NVIDIA
NVIDIA 在https://integrate.api.nvidia.com/v1 提供 OpenAI 兼容 API,支持 Nemotron 和 NeMo 模型。使用来自 NVIDIA NGC 的 API 密钥进行认证。
CLI 设置
导出密钥后运行引导流程并设置 NVIDIA 模型:--token,请注意它会出现在 shell 历史记录和 ps 输出中;建议尽可能使用环境变量。
配置片段
模型 ID
nvidia/llama-3.1-nemotron-70b-instruct(默认)meta/llama-3.3-70b-instructnvidia/mistral-nemo-minitron-8b-8k-instruct
注意事项
- OpenAI 兼容的
/v1端点;使用来自 NVIDIA NGC 的 API 密钥。 - 当设置了
NVIDIA_API_KEY时,提供商会自动启用;使用静态默认值(131,072 Token 上下文窗口,4,096 最大 Token 数)。