版本 v2.0 | 更新日期:2026-06-25
一、🎯平台简介
🔹 🏷️什么是 DaNiu-AI 聚合网关?
DaNiu-AI 是一个大模型聚合平台,您只需注册一个账号、创建一个 API Key,即可通过一套统一的 API 接口,调用多家国内国外大模型供应商的聚合网关。

🔹 🔥支持哪些供应商?
- ✅ 硅基流动(SiliconFlow)
- ✅ DeepSeek
- ✅ 智谱 GLM
- ✅ 通义千问(Qwen)
- ✅ Kimi(Moonshot)
- ✅ 豆包(Doubao)
- ✅ MiniMax
- ✅ NVIDIA(含126个国外众多顶流模型高并发)
🔹 ✅核心特点
- ✔ 一套接口调用所有模型(OpenAI 兼容格式)
- ✔ 自动路由:优先使用 NVIDIA 免费高并发,国内供应商作为保底
- ✔ 按量计费 + 套餐购买(NVIDIA 不限调用次数套餐)
- ✔ 实时查看用量、余额、日志
================================================================
🏆NVIDIA 轮转池 · 国际主流模型列表🏆
================================================================
一、🚀Meta(Llama 系列)
================================================================
meta/llama-3.1-8b-instruct # Llama 3.1 8B 轻量高效
meta/llama-3.1-70b-instruct # Llama 3.1 70B 高性能
meta/llama-3.3-70b-instruct # Llama 3.3 70B 最新版
meta/llama-3.2-1b-instruct # Llama 3.2 1B 超轻量
meta/llama-3.2-3b-instruct # Llama 3.2 3B 轻量
meta/llama-3.2-11b-vision-instruct # Llama 3.2 11B 多模态视觉
meta/llama-3.2-90b-vision-instruct # Llama 3.2 90B 多模态视觉
meta/llama-4-maverick-17b-128e-instruct # Llama 4 17B 最新架构
meta/llama-guard-4-12b # Llama Guard 安全审核
meta/llama2-70b # Llama 2 70B 经典版
meta/codellama-70b # CodeLlama 70B 代码专用
二、☀️Mistral AI 系列
================================================================
mistralai/mistral-7b-instruct-v0.3 # Mistral 7B 经典
mistralai/mixtral-8x7b-instruct-v0.1 # Mixtral 8x7B 混合专家
mistralai/mixtral-8x22b-v0.1 # Mixtral 8x22B 超大混合
mistralai/mistral-large-2-instruct # Mistral Large 2
mistralai/mistral-large-3-675b-instruct-2512 # Mistral Large 3 675B
mistralai/mistral-medium-3.5-128b # Mistral Medium 3.5
mistralai/mistral-small-4-119b-2603 # Mistral Small 4
mistralai/mistral-nemotron # Mistral Nemotron
mistralai/codestral-22b-instruct-v0.1 # CodeStral 22B 代码专用
mistralai/ministral-14b-instruct-2512 # Ministral 14B
三、📊Google(Gemma 系列)
================================================================
google/gemma-2b # Gemma 2B 超轻量
google/gemma-2-2b-it # Gemma 2 2B
google/gemma-3-4b-it # Gemma 3 4B
google/gemma-3-12b-it # Gemma 3 12B
google/gemma-3n-e2b-it # Gemma 3N 2B
google/gemma-3n-e4b-it # Gemma 3N 4B
google/gemma-4-31b-it # Gemma 4 31B 最新
google/recurrentgemma-2b # RecurrentGemma 2B
google/codegemma-7b # CodeGemma 7B 代码
google/codegemma-1.1-7b # CodeGemma 1.1 7B
google/deplot # DePlot 图表理解
四、🔧Microsoft(Phi 系列)
================================================================
microsoft/phi-3.5-moe-instruct # Phi 3.5 MoE 混合专家
microsoft/phi-4-mini-instruct # Phi 4 Mini
microsoft/phi-4-multimodal-instruct # Phi 4 多模态
microsoft/phi-3-vision-128k-instruct # Phi 3 Vision
microsoft/kosmos-2 # Kosmos 2 多模态
五、⭐DeepSeek 系列
================================================================
deepseek-ai/deepseek-v4-flash # DeepSeek V4 Flash 国内主流
deepseek-ai/deepseek-v4-pro # DeepSeek V4 Pro 国内主流
deepseek-ai/deepseek-coder-6.7b-instruct # DeepSeek Coder 6.7B 极速
六、💡其他主流模型
================================================================
Qwen 系列(通义千问)
qwen/qwen3.5-122b-a10b # Qwen 3.5 122B
qwen/qwen3.5-397b-a17b # Qwen 3.5 397B
qwen/qwen3-next-80b-a3b-instruct # Qwen 3 Next 80B
01.AI
01-ai/yi-large # Yi Large
AI21 Labs
ai21labs/jamba-1.5-large-instruct # Jamba 1.5 Large
Snowflake
snowflake/arctic-embed-l # Arctic Embed
Writer
writer/palmyra-creative-122b # Palmyra Creative 122B
writer/palmyra-fin-70b-32k # Palmyra Fin 70B
writer/palmyra-med-70b # Palmyra Med 70B
Upstage
upstage/solar-10.7b-instruct # Solar 10.7B
七、✅快速推荐(按场景)
================================================================
meta/llama-3.3-70b-instruct # 综合能力强,推荐首选
meta/llama-3.1-70b-instruct # 经典稳定
【轻量快速】
meta/llama-3.1-8b-instruct # 8B 轻量,响应快
【代码生成】
meta/codellama-70b # 70B 代码专用
mistralai/codestral-22b-instruct-v0.1 # 22B 代码专用
【多模态/视觉】
meta/llama-3.2-90b-vision-instruct # 90B 视觉
microsoft/phi-4-multimodal-instruct # 多模态
【安全审核】
meta/llama-guard-4-12b # 内容安全审核
【推理/数学】
deepseek-ai/deepseek-v4-pro # 推理能力强
八、🏆优先级说明
================================================================
系统路由策略:
1. 优先使用 NVIDIA 轮转池(包月专用、量大管饱)
2. 如果 NVIDIA 没有该模型,自动路由到国内供应商
3. 多线高效并非,保底使用硅基流动
💡 核心优势:使用 NVIDIA 顶流模型,十万级/分钟 API调用高并发!完全满足10万人同时在线使用!
================================================================


二、🔐注册与登录
2.1 访问平台
打开浏览器,访问:https://daniu-ai.com/gateway/
2.2 注册账号
在首页右上角点击「注册」按钮
填写注册信息:用户名、密码、确认密码
点击「注册」按钮,成功后自动跳转登录页
2.3 登录系统
步骤 1:访问 https://daniu-ai.com/gateway/login
步骤 2:选择登录类型 —— 普通用户请选择「用户登录」
步骤 3:输入用户名 + 密码
步骤 4:点击「登录」,进入控制台
三、🔑创建 API Key
API Key 是您调用 API 的凭证,请妥善保管。
3.1 进入 Key 管理页面
登录后,在左侧菜单栏找到并点击「我的Key」
3.2 创建新的 API Key
步骤 1:点击「创建 Key」按钮
步骤 2:填写 Key 信息(名称、模型分组、过期时间)
步骤 3:点击「创建 Key」按钮
步骤 4:弹出窗口显示完整 API Key,立即复制保存


3.3 管理已有 Key
| 名称 | Key 预览 | 分组 | 状态 | 操作 |
|---|---|---|---|---|
| 生产环境 | sk-abcd****1234 | 默认 | 正常 | [禁用] [删除] |
| 测试环境 | sk-efgh****5678 | 经济 | 停用 | [启用] [删除] |
🔹 禁用:暂时停用该 Key | 启用:重新激活 | 删除:永久删除(不可恢复)
四、💰充值 / 购买套餐
4.1 进入额度管理页面
在左侧菜单栏点击「额度管理」
4.2 查看当前余额
💰 可用余额:¥9000000.998624
📊 今日消耗:¥0.00 | 📈 本月消耗:¥0.00
🎫 当前套餐:未购买
4.3 充值
快速充值:[¥10] [¥50] [¥100] [¥500] [¥1000] [¥5000] [自定义]
支付方式:[💚 微信支付] [💙 支付宝]
4.4 ☀️购买 NVIDIA 套餐
点击「立即购买」→ 联系客服确认开通
4.5 💬联系客服
💬 需要手动充值或遇到问题?联系客服微信:daniu96669

五、📡API 调用指南
5.1 API 基本信息
| 项目 | 内容 |
|---|---|
| API 地址 | https://daniu-ai.com/gateway/v1/chat/completions |
| 认证方式 | Bearer Token(使用您的 API Key) |
| 请求格式 | JSON(OpenAI 兼容格式) |
| 响应格式 | JSON(OpenAI 兼容格式) |
5.2 在线测试(推荐新手使用)
在左侧菜单点击「在线测试」
选择模型:NVIDIA 模型(推荐,高并发) / 硅基流动模型(性价比) / 其他
输入消息:“你好,请简单介绍一下你自己”
参数:Temperature 0.7 | Max Tokens 2048 | 选择 API Key
点击「发送请求」,查看响应及消耗统计
5.3 代码调用
# cURL 示例
curl -X POST https://daniu-ai.com/gateway/v1/chat/completions \
-H "Authorization: Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-v3",
"messages": [
{"role": "system", "content": "你是一个有用的助手"},
{"role": "user", "content": "你好"}
],
"temperature": 0.7,
"max_tokens": 2048
}'
# Python 示例
import requests
url = "https://daniu-ai.com/gateway/v1/chat/completions"
headers = {
"Authorization": "Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
"Content-Type": "application/json"
}
data = {
"model": "deepseek-v3",
"messages": [
{"role": "system", "content": "你是一个有用的助手"},
{"role": "user", "content": "你好"}
],
"temperature": 0.7,
"max_tokens": 2048
}
response = requests.post(url, headers=headers, json=data)
print(response.json())
// JavaScript 示例
fetch('https://daniu-ai.com/gateway/v1/chat/completions', {
method: 'POST',
headers: {
'Authorization': 'Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx',
'Content-Type': 'application/json'
},
body: JSON.stringify({
model: 'deepseek-v3',
messages: [
{role: 'system', content: '你是一个有用的助手'},
{role: 'user', content: '你好'}
],
temperature: 0.7,
max_tokens: 2048
})
})
.then(response => response.json())
.then(data => console.log(data));
六、🧠可用模型列表
6.1 查看所有模型
方法一:在顶部导航点击「模型广场」
方法二:通过 API 获取
curl -X GET https://daniu-ai.com/gateway/v1/models \
-H "Authorization: Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"
6.2 推荐模型
| 模型名称 | 来源 | 特点 | 价格 |
|---|---|---|---|
| meta/llama-3.1-8b-instruct | NVIDIA | 轻量快速 | 套餐包不限调用 |
| meta/llama-3.3-70b-instruct | NVIDIA | 高性能 70B | 套餐包不限调用 |
| nvidia/llama-3.1-nemotron-70b-instruct | NVIDIA | 最强 70B | 套餐包不限调用 |
| deepseek-v3 | DeepSeek | 国产顶级 | 按量计费 |
| Qwen/Qwen2.5-7B-Instruct | 硅基流动 | 性价比高 | 按量计费 |
| glm-4-plus | 智谱 GLM | 综合能力强 | 按量计费 |
| qwen-turbo | 通义千问 | 快速响应 | 按量计费 |
七、📋查看使用日志
7.1 进入日志页面
在左侧菜单点击「使用日志」
7.2 查看调用记录
| 时间 | 模型 | Tokens | 消耗 | 状态 | 操作 |
|---|---|---|---|---|---|
| 06-25 14:30 | meta/llama-3.1-8b | 89 | ¥0.000162 | 成功 | [详情] |
| 06-25 14:25 | deepseek-v3 | 156 | ¥0.000280 | 成功 | [详情] |
| 06-25 14:20 | glm-4-plus | 234 | ¥0.000450 | 失败 | [详情] |
7.3 查看详情
输入 Tokens:16 | 输出 Tokens:73 | 总 Tokens:89
输入成本:¥0.000010 | 输出成本:¥0.000152 | 总成本:¥0.000162
请求数据:{“model”:”deepseek-v3″,”messages”:[…]}
响应数据:{“content”:”你好!我是DeepSeek…”}
八、📊查看余额与消费记录
8.1 进入额度管理页面
在左侧菜单点击「额度管理」
8.2 查看交易记录
| 时间 | 类型 | 金额 | 描述 | 余额 |
|---|---|---|---|---|
| 06-25 10:00 | 充值 | +¥10.000000 | 微信充值 | ¥9.999838 |
| 06-25 06:20 | 消费 | -¥0.000162 | 调用 deepseek-v3 | ¥9.998624 |
| 06-24 15:00 | 套餐 | -¥188.000 | 购买包月套餐 | ¥188.000000 |
筛选:[全部类型 ▼] 可选:充值 / 消费 / 套餐购买 / 退款
九、❓常见问题与错误码
9.1 常见问题
Q1:注册时提示「用户名已存在」
A1:该用户名已被注册,请更换一个用户名。
Q2:登录时提示「用户名或密码错误」
A2:请检查用户名和密码是否正确。如忘记密码,请联系客服重置。
Q3:创建 Key 时提示「分组不存在」
A3:请刷新页面重新加载分组列表,或联系客服。
Q4:调用 API 时返回 401 Unauthorized
A4:请检查 Authorization 头格式是否正确:Authorization: Bearer sk-xxxxxxxx
Q5:调用 API 时返回 402 Payment Required
A5:余额不足,请充值或购买套餐。
Q6:调用 API 时返回 403 Forbidden
A6:API Key 已被禁用或已过期,请在「我的Key」中检查状态。
Q7:调用 API 时返回 404 Not Found
A7:模型名称不存在,请检查模型名称是否正确。
Q8:调用 API 时返回 429 Too Many Requests
A8:请求过于频繁,请稍后重试。
Q9:如何查看我用了哪些模型?
A9:在「使用日志」页面可以查看所有调用记录。
Q10:如何查看我的消费明细?
A10:在「额度管理」页面查看交易记录。
Q11:NVIDIA 模型为什么等高并发呢?
A11:NVIDIA 提供十万级/分钟调用 API 额度,我们通过 10000+ 个 Key 轮转实现企业级高并发。
Q12:套餐购买后什么时候生效?
A12:套餐购买后请联系客服确认开通,通常 5-10 分钟内生效。
9.2 错误码速查表
| 状态码 | 含义 | 解决方法 |
|---|---|---|
| 200 | 成功 | – |
| 400 | 请求格式错误 | 检查 JSON 格式和参数 |
| 401 | 未认证 | 检查 Authorization 头 |
| 402 | 余额不足 | 充值或购买套餐 |
| 403 | API Key 被禁用/过期 | 检查 Key 状态 |
| 404 | 模型不存在 | 检查模型名称 |
| 429 | 请求过于频繁 | 稍后重试 |
| 500 | 服务异常 | 联系客服 |
| 502 | 供应商异常 | 稍后重试或联系客服 |
| 503 | 服务不可用 | 稍后重试或联系客服 |
十、💬联系客服
💬 联系客服
微信:daniu96669 | QQ:1411631627
服务时间:9:00 – 23:00 | 响应时间:通常不超过 30 分钟
📎附录 A:快速参考卡片
网站首页 https://daniu-ai.com/gateway/
登录地址 https://daniu-ai.com/gateway/login
API 地址 https://daniu-ai.com/gateway/v1/chat/completions
模型列表 https://daniu-ai.com/gateway/v1/models
认证方式 Bearer Token(API Key)
🔹 推荐模型:nvidia/llama-3.1-nemotron-70b-instruct(稳定高并发)
🔹 首选套餐:包月专业 ¥188/月(强烈推荐)
文档版本 v2.0 | 更新日期 2026-06-25 | admin








