🔐DaNiu-AI 大模型聚合网关 · 客户使用手册

2026-06-27 3,285 阅读 收藏

版本 v2.0 | 更新日期:2026-06-25


一、🎯平台简介

🔹 🏷️什么是 DaNiu-AI 聚合网关?

     DaNiu-AI 是一个大模型聚合平台,您只需注册一个账号、创建一个 API Key,即可通过一套统一的 API 接口,调用多家国内国外大模型供应商的聚合网关。

🔹 🔥支持哪些供应商?

  • ✅ 硅基流动(SiliconFlow)
  • ✅ DeepSeek
  • ✅ 智谱 GLM
  • ✅ 通义千问(Qwen)
  • ✅ Kimi(Moonshot)
  • ✅ 豆包(Doubao)
  • ✅ MiniMax
  • ✅ NVIDIA(含126个国外众多顶流模型高并发)

🔹 ✅核心特点

  • ✔ 一套接口调用所有模型(OpenAI 兼容格式)
  • ✔ 自动路由:优先使用 NVIDIA 免费高并发,国内供应商作为保底
  • ✔ 按量计费 + 套餐购买(NVIDIA 不限调用次数套餐)
  • ✔ 实时查看用量、余额、日志

🔹 🏷️国际主流模型列表

================================================================
🏆NVIDIA 轮转池 · 国际主流模型列表🏆
================================================================

一、🚀Meta(Llama 系列)
================================================================
meta/llama-3.1-8b-instruct # Llama 3.1 8B 轻量高效
meta/llama-3.1-70b-instruct # Llama 3.1 70B 高性能
meta/llama-3.3-70b-instruct # Llama 3.3 70B 最新版
meta/llama-3.2-1b-instruct # Llama 3.2 1B 超轻量
meta/llama-3.2-3b-instruct # Llama 3.2 3B 轻量
meta/llama-3.2-11b-vision-instruct # Llama 3.2 11B 多模态视觉
meta/llama-3.2-90b-vision-instruct # Llama 3.2 90B 多模态视觉
meta/llama-4-maverick-17b-128e-instruct # Llama 4 17B 最新架构
meta/llama-guard-4-12b # Llama Guard 安全审核
meta/llama2-70b # Llama 2 70B 经典版
meta/codellama-70b # CodeLlama 70B 代码专用

二、☀️Mistral AI 系列
================================================================
mistralai/mistral-7b-instruct-v0.3 # Mistral 7B 经典
mistralai/mixtral-8x7b-instruct-v0.1 # Mixtral 8x7B 混合专家
mistralai/mixtral-8x22b-v0.1 # Mixtral 8x22B 超大混合
mistralai/mistral-large-2-instruct # Mistral Large 2
mistralai/mistral-large-3-675b-instruct-2512 # Mistral Large 3 675B
mistralai/mistral-medium-3.5-128b # Mistral Medium 3.5
mistralai/mistral-small-4-119b-2603 # Mistral Small 4
mistralai/mistral-nemotron # Mistral Nemotron
mistralai/codestral-22b-instruct-v0.1 # CodeStral 22B 代码专用
mistralai/ministral-14b-instruct-2512 # Ministral 14B

三、📊Google(Gemma 系列)
================================================================
google/gemma-2b # Gemma 2B 超轻量
google/gemma-2-2b-it # Gemma 2 2B
google/gemma-3-4b-it # Gemma 3 4B
google/gemma-3-12b-it # Gemma 3 12B
google/gemma-3n-e2b-it # Gemma 3N 2B
google/gemma-3n-e4b-it # Gemma 3N 4B
google/gemma-4-31b-it # Gemma 4 31B 最新
google/recurrentgemma-2b # RecurrentGemma 2B
google/codegemma-7b # CodeGemma 7B 代码
google/codegemma-1.1-7b # CodeGemma 1.1 7B
google/deplot # DePlot 图表理解

四、🔧Microsoft(Phi 系列)
================================================================
microsoft/phi-3.5-moe-instruct # Phi 3.5 MoE 混合专家
microsoft/phi-4-mini-instruct # Phi 4 Mini
microsoft/phi-4-multimodal-instruct # Phi 4 多模态
microsoft/phi-3-vision-128k-instruct # Phi 3 Vision
microsoft/kosmos-2 # Kosmos 2 多模态

五、⭐DeepSeek 系列
================================================================
deepseek-ai/deepseek-v4-flash # DeepSeek V4 Flash  国内主流
deepseek-ai/deepseek-v4-pro # DeepSeek V4 Pro  国内主流
deepseek-ai/deepseek-coder-6.7b-instruct # DeepSeek Coder 6.7B  极速

六、💡其他主流模型
================================================================
Qwen 系列(通义千问)
qwen/qwen3.5-122b-a10b # Qwen 3.5 122B
qwen/qwen3.5-397b-a17b # Qwen 3.5 397B
qwen/qwen3-next-80b-a3b-instruct # Qwen 3 Next 80B

01.AI
01-ai/yi-large # Yi Large

AI21 Labs
ai21labs/jamba-1.5-large-instruct # Jamba 1.5 Large

Snowflake
snowflake/arctic-embed-l # Arctic Embed

Writer
writer/palmyra-creative-122b # Palmyra Creative 122B
writer/palmyra-fin-70b-32k # Palmyra Fin 70B
writer/palmyra-med-70b # Palmyra Med 70B

Upstage
upstage/solar-10.7b-instruct # Solar 10.7B

七、✅快速推荐(按场景)
================================================================
meta/llama-3.3-70b-instruct # 综合能力强,推荐首选
meta/llama-3.1-70b-instruct # 经典稳定

【轻量快速】
meta/llama-3.1-8b-instruct # 8B 轻量,响应快

【代码生成】
meta/codellama-70b # 70B 代码专用
mistralai/codestral-22b-instruct-v0.1 # 22B 代码专用

【多模态/视觉】
meta/llama-3.2-90b-vision-instruct # 90B 视觉
microsoft/phi-4-multimodal-instruct # 多模态

【安全审核】
meta/llama-guard-4-12b # 内容安全审核

【推理/数学】
deepseek-ai/deepseek-v4-pro # 推理能力强

八、🏆优先级说明
================================================================

系统路由策略:
1. 优先使用 NVIDIA 轮转池(包月专用、量大管饱)
2. 如果 NVIDIA 没有该模型,自动路由到国内供应商
3. 多线高效并非,保底使用硅基流动

💡 核心优势:使用 NVIDIA 顶流模型,十万级/分钟 API调用高并发!完全满足10万人同时在线使用!

================================================================

 
🖼️ 配图位置 1:十万级API高并发/分钟

(应用 → DaNiu-AI 网关 → NVIDIA / 硅基 / DeepSeek 等)

二、🔐注册与登录

2.1 访问平台

打开浏览器,访问:https://daniu-ai.com/gateway/

2.2 注册账号

📝 步骤 1

在首页右上角点击「注册」按钮

📝 步骤 2

填写注册信息:用户名、密码、确认密码

📝 步骤 3

点击「注册」按钮,成功后自动跳转登录页

🖼️ 配图位置 2:注册页面截图

提醒:请妥善保管您的用户名、密码,是您使用大模型的唯一凭证

2.3 登录系统

步骤 1:访问 https://daniu-ai.com/gateway/login

步骤 2选择登录类型 —— 普通用户请选择「用户登录」

步骤 3:输入用户名 + 密码

步骤 4:点击「登录」,进入控制台

🖼️ 配图位置 3:登录页面截图

标注登录类型切换、用户名、密码、登录按钮

三、🔑创建 API Key

API Key 是您调用 API 的凭证,请妥善保管。

3.1 进入 Key 管理页面

登录后,在左侧菜单栏找到并点击「我的Key」

🖼️配图位置 4:左侧菜单截图(红框标注「我的Key」)

3.2 创建新的 API Key

步骤 1:点击「创建 Key」按钮

步骤 2:填写 Key 信息(名称、模型分组、过期时间)

步骤 3:点击「创建 Key」按钮

步骤 4:弹出窗口显示完整 API Key,立即复制保存

⚠️ 此 Key 仅显示一次,关闭后无法再次查看完整 Key。

🖼️配图位置 5:创建 Key 页面截图(注意备份保存key)

3.3 管理已有 Key

名称 Key 预览 分组 状态 操作
生产环境 sk-abcd****1234 默认 正常 [禁用] [删除]
测试环境 sk-efgh****5678 经济 停用 [启用] [删除]

🔹 禁用:暂时停用该 Key | 启用:重新激活 | 删除:永久删除(不可恢复)

四、💰充值 / 购买套餐

4.1 进入额度管理页面

在左侧菜单栏点击「额度管理

🖼️配图位置 6:额度管理页面截图

4.2 查看当前余额

💰 可用余额:¥9000000.998624

📊 今日消耗:¥0.00 | 📈 本月消耗:¥0.00

🎫 当前套餐:未购

4.3 充值

快速充值[¥10] [¥50] [¥100] [¥500] [¥1000] [¥5000] [自定义]

支付方式:[💚 微信支付]   [💙 支付宝]

⚠️ 说明:当前为模拟充值,实际支付功能开发中。充值后请联系客服确认到账。

4.4 ☀️购买 NVIDIA 套餐

☀️ 包天体验 ¥8.8/天 · 24小时有效
📅 包周畅享 ¥88/周 · 7天有效 热销
📆 包月专业 ¥188/月 · 30天有效 强烈推荐
🏆 包年企业 ¥1880/年 · 365天有效

点击「立即购买」→ 联系客服确认开通

4.5 💬联系客服

💬 需要手动充值或遇到问题?联系客服微信:daniu96669

📱 扫码联系客服(点击弹出二维码)

🖼️配图位置 7:二维码弹窗截图(客服微信二维码)

五、📡API 调用指南

5.1 API 基本信息

项目 内容
API 地址 https://daniu-ai.com/gateway/v1/chat/completions
认证方式 Bearer Token(使用您的 API Key)
请求格式 JSON(OpenAI 兼容格式)
响应格式 JSON(OpenAI 兼容格式)

5.2 在线测试(推荐新手使用)

在左侧菜单点击「在线测试」

🖼️配图位置 8:在线测试页面截图

选择模型:NVIDIA 模型(推荐,高并发) / 硅基流动模型(性价比) / 其他

输入消息:“你好,请简单介绍一下你自己”

参数:Temperature 0.7 | Max Tokens 2048 | 选择 API Key

点击「发送请求」,查看响应及消耗统计

5.3 代码调用

bash
# cURL 示例
curl -X POST https://daniu-ai.com/gateway/v1/chat/completions \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "deepseek-v3",
    "messages": [
      {"role": "system", "content": "你是一个有用的助手"},
      {"role": "user", "content": "你好"}
    ],
    "temperature": 0.7,
    "max_tokens": 2048
  }'

python
# Python 示例
import requests

url = "https://daniu-ai.com/gateway/v1/chat/completions"
headers = {
    "Authorization": "Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx",
    "Content-Type": "application/json"
}
data = {
    "model": "deepseek-v3",
    "messages": [
        {"role": "system", "content": "你是一个有用的助手"},
        {"role": "user", "content": "你好"}
    ],
    "temperature": 0.7,
    "max_tokens": 2048
}

response = requests.post(url, headers=headers, json=data)
print(response.json())

javascript
// JavaScript 示例
fetch('https://daniu-ai.com/gateway/v1/chat/completions', {
    method: 'POST',
    headers: {
        'Authorization': 'Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx',
        'Content-Type': 'application/json'
    },
    body: JSON.stringify({
        model: 'deepseek-v3',
        messages: [
            {role: 'system', content: '你是一个有用的助手'},
            {role: 'user', content: '你好'}
        ],
        temperature: 0.7,
        max_tokens: 2048
    })
})
.then(response => response.json())
.then(data => console.log(data));

六、🧠可用模型列表

6.1 查看所有模型

方法一:在顶部导航点击「模型广场」

🖼️配图位置 10:模型广场截图

方法二:通过 API 获取

bash
curl -X GET https://daniu-ai.com/gateway/v1/models \
  -H "Authorization: Bearer sk-xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx"

6.2 推荐模型

模型名称 来源 特点 价格
meta/llama-3.1-8b-instruct NVIDIA 轻量快速 套餐包不限调用
meta/llama-3.3-70b-instruct NVIDIA 高性能 70B 套餐包不限调用
nvidia/llama-3.1-nemotron-70b-instruct NVIDIA 最强 70B 套餐包不限调用
deepseek-v3 DeepSeek 国产顶级 按量计费
Qwen/Qwen2.5-7B-Instruct 硅基流动 性价比高 按量计费
glm-4-plus 智谱 GLM 综合能力强 按量计费
qwen-turbo 通义千问 快速响应 按量计费
💡 建议:优先使用 NVIDIA 模型(套餐不限调用、高并发、性能好

七、📋查看使用日志

7.1 进入日志页面

在左侧菜单点击「使用日志」

🖼️配图位置 11:使用日志页面截图

7.2 查看调用记录

时间 模型 Tokens 消耗 状态 操作
06-25 14:30 meta/llama-3.1-8b 89 ¥0.000162 成功 [详情]
06-25 14:25 deepseek-v3 156 ¥0.000280 成功 [详情]
06-25 14:20 glm-4-plus 234 ¥0.000450 失败 [详情]

7.3 查看详情

输入 Tokens:16 | 输出 Tokens:73 | 总 Tokens:89

输入成本:¥0.000010 | 输出成本:¥0.000152 | 总成本:¥0.000162

请求数据:{“model”:”deepseek-v3″,”messages”:[…]}

响应数据:{“content”:”你好!我是DeepSeek…”}

八、📊查看余额与消费记录

8.1 进入额度管理页面

在左侧菜单点击「额度管理」

🖼️配图位置 12:额度管理完整截图

8.2 查看交易记录

时间 类型 金额 描述 余额
06-25 10:00 充值 +¥10.000000 微信充值 ¥9.999838
06-25 06:20 消费 -¥0.000162 调用 deepseek-v3 ¥9.998624
06-24 15:00 套餐 -¥188.000 购买包月套餐 ¥188.000000

筛选:[全部类型 ▼] 可选:充值 / 消费 / 套餐购买 / 退款

九、❓常见问题与错误码

9.1 常见问题

Q1:注册时提示「用户名已存在」
A1:该用户名已被注册,请更换一个用户名。

Q2:登录时提示「用户名或密码错误」
A2:请检查用户名和密码是否正确。如忘记密码,请联系客服重置。

Q3:创建 Key 时提示「分组不存在」
A3:请刷新页面重新加载分组列表,或联系客服。

Q4:调用 API 时返回 401 Unauthorized
A4:请检查 Authorization 头格式是否正确:Authorization: Bearer sk-xxxxxxxx

Q5:调用 API 时返回 402 Payment Required
A5:余额不足,请充值或购买套餐。

Q6:调用 API 时返回 403 Forbidden
A6:API Key 已被禁用或已过期,请在「我的Key」中检查状态。

Q7:调用 API 时返回 404 Not Found
A7:模型名称不存在,请检查模型名称是否正确。

Q8:调用 API 时返回 429 Too Many Requests
A8:请求过于频繁,请稍后重试。

Q9:如何查看我用了哪些模型?
A9:在「使用日志」页面可以查看所有调用记录。

Q10:如何查看我的消费明细?
A10:在「额度管理」页面查看交易记录。

Q11:NVIDIA 模型为什么等高并发呢?
A11:NVIDIA 提供十万级/分钟调用 API 额度,我们通过 10000+ 个 Key 轮转实现企业级高并发。

Q12:套餐购买后什么时候生效?
A12:套餐购买后请联系客服确认开通,通常 5-10 分钟内生效。

9.2 错误码速查表

状态码 含义 解决方法
200 成功
400 请求格式错误 检查 JSON 格式和参数
401 未认证 检查 Authorization 头
402 余额不足 充值或购买套餐
403 API Key 被禁用/过期 检查 Key 状态
404 模型不存在 检查模型名称
429 请求过于频繁 稍后重试
500 服务异常 联系客服
502 供应商异常 稍后重试或联系客服
503 服务不可用 稍后重试或联系客服

🖼️配图位置 13:错误提示截图示例

十、💬联系客服

💬 联系客服

微信:daniu96669 | QQ:1411631627

📱企业客户请单独致电沟通

服务时间:9:00 – 23:00 | 响应时间:通常不超过 30 分钟

📎附录 A:快速参考卡片

网站首页 https://daniu-ai.com/gateway/

登录地址 https://daniu-ai.com/gateway/login

API 地址 https://daniu-ai.com/gateway/v1/chat/completions

模型列表 https://daniu-ai.com/gateway/v1/models

认证方式 Bearer Token(API Key)


🔹 推荐模型:nvidia/llama-3.1-nemotron-70b-instruct(稳定高并发)

🔹 首选套餐:包月专业 ¥188/月(强烈推荐)


文档版本 v2.0 | 更新日期 2026-06-25 | admin