版本 v2.0 ｜更新日期：2026-06-25

一、🎯平台简介

🔹 🏷️什么是 DaNiu-AI 聚合网关？

DaNiu-AI 是一个大模型聚合平台，您只需注册一个账号、创建一个 API Key，即可通过一套统一的 API 接口，调用多家国内国外大模型供应商的聚合网关。

🔹 🔥支持哪些供应商？

✅ 硅基流动（SiliconFlow）
✅ DeepSeek
✅ 智谱 GLM
✅ 通义千问（Qwen）
✅ Kimi（Moonshot）
✅ 豆包（Doubao）
✅ MiniMax
✅ NVIDIA（含126个国外众多顶流模型高并发）

🔹 ✅核心特点

✔ 一套接口调用所有模型（OpenAI 兼容格式）
✔ 自动路由：优先使用 NVIDIA 免费高并发，国内供应商作为保底
✔ 按量计费 + 套餐购买（NVIDIA 不限调用次数套餐）
✔ 实时查看用量、余额、日志

🔹 🏷️国际主流模型列表

================================================================
🏆NVIDIA 轮转池 · 国际主流模型列表🏆
================================================================

一、🚀Meta（Llama 系列）
================================================================
meta/llama-3.1-8b-instruct # Llama 3.1 8B 轻量高效
meta/llama-3.1-70b-instruct # Llama 3.1 70B 高性能
meta/llama-3.3-70b-instruct # Llama 3.3 70B 最新版
meta/llama-3.2-1b-instruct # Llama 3.2 1B 超轻量
meta/llama-3.2-3b-instruct # Llama 3.2 3B 轻量
meta/llama-3.2-11b-vision-instruct # Llama 3.2 11B 多模态视觉
meta/llama-3.2-90b-vision-instruct # Llama 3.2 90B 多模态视觉
meta/llama-4-maverick-17b-128e-instruct # Llama 4 17B 最新架构
meta/llama-guard-4-12b # Llama Guard 安全审核
meta/llama2-70b # Llama 2 70B 经典版
meta/codellama-70b # CodeLlama 70B 代码专用

二、☀️Mistral AI 系列
================================================================
mistralai/mistral-7b-instruct-v0.3 # Mistral 7B 经典
mistralai/mixtral-8x7b-instruct-v0.1 # Mixtral 8x7B 混合专家
mistralai/mixtral-8x22b-v0.1 # Mixtral 8x22B 超大混合
mistralai/mistral-large-2-instruct # Mistral Large 2
mistralai/mistral-large-3-675b-instruct-2512 # Mistral Large 3 675B
mistralai/mistral-medium-3.5-128b # Mistral Medium 3.5
mistralai/mistral-small-4-119b-2603 # Mistral Small 4
mistralai/mistral-nemotron # Mistral Nemotron
mistralai/codestral-22b-instruct-v0.1 # CodeStral 22B 代码专用
mistralai/ministral-14b-instruct-2512 # Ministral 14B

三、📊Google（Gemma 系列）
================================================================
google/gemma-2b # Gemma 2B 超轻量
google/gemma-2-2b-it # Gemma 2 2B
google/gemma-3-4b-it # Gemma 3 4B
google/gemma-3-12b-it # Gemma 3 12B
google/gemma-3n-e2b-it # Gemma 3N 2B
google/gemma-3n-e4b-it # Gemma 3N 4B
google/gemma-4-31b-it # Gemma 4 31B 最新
google/recurrentgemma-2b # RecurrentGemma 2B
google/codegemma-7b # CodeGemma 7B 代码
google/codegemma-1.1-7b # CodeGemma 1.1 7B
google/deplot # DePlot 图表理解

四、🔧Microsoft（Phi 系列）
================================================================
microsoft/phi-3.5-moe-instruct # Phi 3.5 MoE 混合专家
microsoft/phi-4-mini-instruct # Phi 4 Mini
microsoft/phi-4-multimodal-instruct # Phi 4 多模态
microsoft/phi-3-vision-128k-instruct # Phi 3 Vision
microsoft/kosmos-2 # Kosmos 2 多模态

五、⭐DeepSeek 系列
================================================================
deepseek-ai/deepseek-v4-flash # DeepSeek V4 Flash 国内主流
deepseek-ai/deepseek-v4-pro # DeepSeek V4 Pro 国内主流
deepseek-ai/deepseek-coder-6.7b-instruct # DeepSeek Coder 6.7B 极速

六、💡其他主流模型
================================================================
Qwen 系列（通义千问）
qwen/qwen3.5-122b-a10b # Qwen 3.5 122B
qwen/qwen3.5-397b-a17b # Qwen 3.5 397B
qwen/qwen3-next-80b-a3b-instruct # Qwen 3 Next 80B

01.AI
01-ai/yi-large # Yi Large

AI21 Labs
ai21labs/jamba-1.5-large-instruct # Jamba 1.5 Large

Snowflake
snowflake/arctic-embed-l # Arctic Embed

Writer
writer/palmyra-creative-122b # Palmyra Creative 122B
writer/palmyra-fin-70b-32k # Palmyra Fin 70B
writer/palmyra-med-70b # Palmyra Med 70B

Upstage
upstage/solar-10.7b-instruct # Solar 10.7B

七、✅快速推荐（按场景）
================================================================
meta/llama-3.3-70b-instruct # 综合能力强，推荐首选
meta/llama-3.1-70b-instruct # 经典稳定

【轻量快速】
meta/llama-3.1-8b-instruct # 8B 轻量，响应快

【代码生成】
meta/codellama-70b # 70B 代码专用
mistralai/codestral-22b-instruct-v0.1 # 22B 代码专用

【多模态/视觉】
meta/llama-3.2-90b-vision-instruct # 90B 视觉
microsoft/phi-4-multimodal-instruct # 多模态

【安全审核】
meta/llama-guard-4-12b # 内容安全审核

【推理/数学】
deepseek-ai/deepseek-v4-pro # 推理能力强

八、🏆优先级说明
================================================================

系统路由策略：
1. 优先使用 NVIDIA 轮转池（包月专用、量大管饱）
2. 如果 NVIDIA 没有该模型，自动路由到国内供应商
3. 多线高效并非，保底使用硅基流动

💡 核心优势：使用 NVIDIA 顶流模型，十万级/分钟 API调用高并发！完全满足10万人同时在线使用！

================================================================

🖼️ 配图位置 1：十万级API高并发/分钟

（应用 → DaNiu-AI 网关 → NVIDIA / 硅基 / DeepSeek 等）

二、🔐注册与登录

2.1 访问平台

打开浏览器，访问：https://daniu-ai.com/gateway/

2.2 注册账号

📝 步骤 1

在首页右上角点击「注册」按钮

📝 步骤 2

填写注册信息：用户名、密码、确认密码

📝 步骤 3

点击「注册」按钮，成功后自动跳转登录页

🖼️ 配图位置 2：注册页面截图

提醒：请妥善保管您的用户名、密码，是您使用大模型的唯一凭证

2.3 登录系统

步骤 1：访问 https://daniu-ai.com/gateway/login

步骤 2：选择登录类型 —— 普通用户请选择「用户登录」

步骤 3：输入用户名 + 密码

步骤 4：点击「登录」，进入控制台

🖼️ 配图位置 3：登录页面截图

标注登录类型切换、用户名、密码、登录按钮

三、🔑创建 API Key

API Key 是您调用 API 的凭证，请妥善保管。

3.1 进入 Key 管理页面

登录后，在左侧菜单栏找到并点击「我的Key」

🖼️配图位置 4：左侧菜单截图（红框标注「我的Key」）

3.2 创建新的 API Key

步骤 1：点击「创建 Key」按钮

步骤 2：填写 Key 信息（名称、模型分组、过期时间）

步骤 3：点击「创建 Key」按钮

步骤 4：弹出窗口显示完整 API Key，立即复制保存

⚠️ 此 Key 仅显示一次，关闭后无法再次查看完整 Key。

🖼️配图位置 5：创建 Key 页面截图（注意备份保存key）

3.3 管理已有 Key

名称	Key 预览	分组	状态	操作
生产环境	sk-abcd****1234	默认	正常	[禁用] [删除]
测试环境	sk-efgh****5678	经济	停用	[启用] [删除]

🔹 禁用：暂时停用该 Key ｜启用：重新激活｜删除：永久删除（不可恢复）

四、💰充值 / 购买套餐

4.1 进入额度管理页面

在左侧菜单栏点击「额度管理」

🖼️配图位置 6：额度管理页面截图

4.2 查看当前余额

💰 可用余额：¥9000000.998624

📊 今日消耗：¥0.00 ｜ 📈 本月消耗：¥0.00

🎫 当前套餐：未购买

4.3 充值

快速充值：[¥10] [¥50] [¥100] [¥500] [¥1000] [¥5000] [自定义]

支付方式：[💚 微信支付] [💙 支付宝]

⚠️ 说明：当前为模拟充值，实际支付功能开发中。充值后请联系客服确认到账。

4.4 ☀️购买 NVIDIA 套餐

☀️ 包天体验 ¥8.8/天 · 24小时有效

📅 包周畅享 ¥88/周 · 7天有效热销

📆 包月专业 ¥188/月 · 30天有效强烈推荐

🏆 包年企业 ¥1880/年 · 365天有效

点击「立即购买」→ 联系客服确认开通

4.5 💬联系客服

💬 需要手动充值或遇到问题？联系客服微信：daniu96669

📱 扫码联系客服（点击弹出二维码）

🖼️配图位置 7：二维码弹窗截图（客服微信二维码）

五、📡API 调用指南

5.1 API 基本信息

项目	内容
API 地址	`https://daniu-ai.com/gateway/v1/chat/completions`
认证方式	Bearer Token（使用您的 API Key）
请求格式	JSON（OpenAI 兼容格式）
响应格式	JSON（OpenAI 兼容格式）

5.2 在线测试（推荐新手使用）

在左侧菜单点击「在线测试」

🖼️配图位置 8：在线测试页面截图

选择模型：NVIDIA 模型（推荐，高并发） / 硅基流动模型（性价比） / 其他

输入消息：“你好，请简单介绍一下你自己”

参数：Temperature 0.7 ｜ Max Tokens 2048 ｜选择 API Key

点击「发送请求」，查看响应及消耗统计

5.3 代码调用

bash

# cURL 示例
curl -X POST https://daniu-ai.com/gateway/v1/chat/completions \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v3",
    "messages": [
      {"role": "system", "content": "你是一个有用的助手"},
      {"role": "user", "content": "你好"}
    ],
    "temperature": 0.7,
    "max_tokens": 2048
  }'

python

# Python 示例
import requests

url = "https://daniu-ai.com/gateway/v1/chat/completions"
headers = {
    "Authorization": "Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
    "Content-Type": "application/json"
}
data = {
    "model": "deepseek-v3",
    "messages": [
        {"role": "system", "content": "你是一个有用的助手"},
        {"role": "user", "content": "你好"}
    ],
    "temperature": 0.7,
    "max_tokens": 2048
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

javascript

// JavaScript 示例
fetch('https://daniu-ai.com/gateway/v1/chat/completions', {
    method: 'POST',
    headers: {
        'Authorization': 'Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx',
        'Content-Type': 'application/json'
    },
    body: JSON.stringify({
        model: 'deepseek-v3',
        messages: [
            {role: 'system', content: '你是一个有用的助手'},
            {role: 'user', content: '你好'}
        ],
        temperature: 0.7,
        max_tokens: 2048
    })
})
.then(response => response.json())
.then(data => console.log(data));

六、🧠可用模型列表

6.1 查看所有模型

方法一：在顶部导航点击「模型广场」

🖼️配图位置 10：模型广场截图

方法二：通过 API 获取

bash

curl -X GET https://daniu-ai.com/gateway/v1/models \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

6.2 推荐模型

模型名称	来源	特点	价格
meta/llama-3.1-8b-instruct	NVIDIA	轻量快速	套餐包不限调用
meta/llama-3.3-70b-instruct	NVIDIA	高性能 70B	套餐包不限调用
nvidia/llama-3.1-nemotron-70b-instruct	NVIDIA	最强 70B	套餐包不限调用
deepseek-v3	DeepSeek	国产顶级	按量计费
Qwen/Qwen2.5-7B-Instruct	硅基流动	性价比高	按量计费
glm-4-plus	智谱 GLM	综合能力强	按量计费
qwen-turbo	通义千问	快速响应	按量计费

💡 建议：优先使用 NVIDIA 模型（套餐不限调用、高并发、性能好）

七、📋查看使用日志

7.1 进入日志页面

在左侧菜单点击「使用日志」

🖼️配图位置 11：使用日志页面截图

7.2 查看调用记录

时间	模型	Tokens	消耗	状态	操作
06-25 14:30	meta/llama-3.1-8b	89	¥0.000162	成功	[详情]
06-25 14:25	deepseek-v3	156	¥0.000280	成功	[详情]
06-25 14:20	glm-4-plus	234	¥0.000450	失败	[详情]

7.3 查看详情

输入 Tokens：16 ｜输出 Tokens：73 ｜总 Tokens：89

输入成本：¥0.000010 ｜输出成本：¥0.000152 ｜总成本：¥0.000162

请求数据：{“model”:”deepseek-v3″,”messages”:[…]}

响应数据：{“content”:”你好！我是DeepSeek…”}

八、📊查看余额与消费记录

8.1 进入额度管理页面

在左侧菜单点击「额度管理」

🖼️配图位置 12：额度管理完整截图

8.2 查看交易记录

时间	类型	金额	描述	余额
06-25 10:00	充值	+¥10.000000	微信充值	¥9.999838
06-25 06:20	消费	-¥0.000162	调用 deepseek-v3	¥9.998624
06-24 15:00	套餐	-¥188.000	购买包月套餐	¥188.000000

筛选：[全部类型 ▼] 可选：充值 / 消费 / 套餐购买 / 退款

九、❓常见问题与错误码

9.1 常见问题

Q1：注册时提示「用户名已存在」
A1：该用户名已被注册，请更换一个用户名。

Q2：登录时提示「用户名或密码错误」
A2：请检查用户名和密码是否正确。如忘记密码，请联系客服重置。

Q3：创建 Key 时提示「分组不存在」
A3：请刷新页面重新加载分组列表，或联系客服。

Q4：调用 API 时返回 401 Unauthorized
A4：请检查 Authorization 头格式是否正确：Authorization: Bearer sk-xxxxxxxx

Q5：调用 API 时返回 402 Payment Required
A5：余额不足，请充值或购买套餐。

Q6：调用 API 时返回 403 Forbidden
A6：API Key 已被禁用或已过期，请在「我的Key」中检查状态。

Q7：调用 API 时返回 404 Not Found
A7：模型名称不存在，请检查模型名称是否正确。

Q8：调用 API 时返回 429 Too Many Requests
A8：请求过于频繁，请稍后重试。

Q9：如何查看我用了哪些模型？
A9：在「使用日志」页面可以查看所有调用记录。

Q10：如何查看我的消费明细？
A10：在「额度管理」页面查看交易记录。

Q11：NVIDIA 模型为什么等高并发呢？
A11：NVIDIA 提供十万级/分钟调用 API 额度，我们通过 10000+ 个 Key 轮转实现企业级高并发。

Q12：套餐购买后什么时候生效？
A12：套餐购买后请联系客服确认开通，通常 5-10 分钟内生效。

9.2 错误码速查表

状态码	含义	解决方法
200	成功	–
400	请求格式错误	检查 JSON 格式和参数
401	未认证	检查 Authorization 头
402	余额不足	充值或购买套餐
403	API Key 被禁用/过期	检查 Key 状态
404	模型不存在	检查模型名称
429	请求过于频繁	稍后重试
500	服务异常	联系客服
502	供应商异常	稍后重试或联系客服
503	服务不可用	稍后重试或联系客服

🖼️配图位置 13：错误提示截图示例

十、💬联系客服

💬 联系客服

微信：daniu96669 ｜ QQ：1411631627

📱企业客户请单独致电沟通

服务时间：9:00 – 23:00 ｜响应时间：通常不超过 30 分钟

📎附录 A：快速参考卡片

网站首页 https://daniu-ai.com/gateway/

登录地址 https://daniu-ai.com/gateway/login

API 地址 https://daniu-ai.com/gateway/v1/chat/completions

模型列表 https://daniu-ai.com/gateway/v1/models

认证方式 Bearer Token（API Key）

🔹 推荐模型：nvidia/llama-3.1-nemotron-70b-instruct（稳定高并发）

🔹 首选套餐：包月专业 ¥188/月（强烈推荐）

文档版本 v2.0 ｜更新日期 2026-06-25 ｜ admin

技术文档作者，专注于AI智能体开发。

🔐DaNiu-AI 大模型聚合网关 · 客户使用手册