Gateway一个入口管理主流 AI 能力

把多模型接入这件事收敛成一套更省心的接口

不用再为不同厂商分别维护账号、密钥和计费逻辑。一次接入后,就可以在qwen、kimi、deepseek之间更灵活地选择能力。

计费规则公开可见,失败请求不收费
预算、权限、IP 范围都能提前设好
兼容 OpenAI 风格调用,接入成本低
复制即用

先跑通一次真实请求,再决定后面接哪类模型

curl {API_BASE_URL}/v1/chat/completions \
-H "Authorization: Bearer $API_KEY" \
-H "Content-Type: application/json" \
-d '{"model":"qwen3.6-flash","messages":[{"role":"user","content":"Hello from Kunlun AI"}]}'
API 地址{API_BASE_URL}/

按任务选型

主流模型能力,一页就能看清楚

文本、多模态、图像和视频相关能力都已经整理好。你不需要先研究厂商生态,先按业务目标选方向就够了。

更适合先看懂再接入,而不是先写一堆适配代码

差异化价值

真正麻烦的,不是调接口,而是后面那一串管理问题

模型一多,复杂度通常不在首个请求,而在后面的维护、结算和协作。

×不同模型有不同参数和调用方式,稍微扩展一下能力,接入代码就开始散掉。
×充值、消耗和账单分散在多个平台里,成本越来越难核对,也越来越难解释。
×团队协作时最怕 Key 外泄或权限失控,很多问题不是不能用,而是不敢放开用。

先接一个入口,再慢慢扩模型

不用为了每个新模型都重搭一遍接入层。先把统一入口接好,后续扩能力会轻很多。

价格规则讲清楚,不让账单靠猜

输入、输出和按次计费都会直接展示,失败请求不收费,花在哪里也能回头查。

权限、预算和边界可以先设好

每个 Key 都能单独限制模型范围、IP、有效期和预算,避免团队一放开就失控。

用量和趋势看得见,优化才有依据

控制台能看请求、Token、消耗趋势和日志,出了问题也更容易定位与止损。

开始方式

接入流程尽量做短,第一次调用不用折腾太久

先注册、再建 Key、最后把地址换进去,大多数团队都能很快跑通第一轮测试。

1

注册后先拿到可用额度

先进入后台,把账户和基础环境准备好,不需要先走复杂采购流程。

2

创建一个合适的 API Key

根据团队或项目需要配置模型权限、预算和访问限制,把边界提前设清楚。

3

替换地址后发出第一个请求

继续沿用 OpenAI SDK、curl 或已有工作流,把 base URL 和 Key 换掉就能测试。

我们的原则

我们想做的,不只是能用,而是长期也好用

首页真正想表达的不是“模型很多”,而是把接入、使用、协作和计费这几件事一起理顺。

第一次接入应该顺畅,开发者不该把时间浪费在重复适配上。

接入效率

计费必须说人话,业务、运营和采购都应该能直接看懂。

清楚算账

团队协作要能放得开,但前提是权限和风险边界足够明确。

协作可控

FAQ

接入之前常问的问题,这里先说清楚

少一点模糊表述,多一点可以直接判断的信息。

我的调用数据会被留存、泄露吗?会不会用于训练?+

不会。我们按严格的数据保护思路处理调用记录,不会把你的业务数据拿去做模型训练,也不会对外泄露调用内容。

API Key 泄露了怎么办?会不会被刷爆额度?+

每个 Key 都支持预算、模型范围、IP 白名单和有效期控制,异常消耗也可以通过后台快速发现并止损。

会不会有隐藏扣费?失败请求收费吗?+

不会。价格规则直接公开展示,失败请求不收费,输入、输出和按次计费都能提前看到。

充值的余额会过期吗?有没有最低消费?+

余额永久有效,想用就用,无最低消费门槛。

先小范围开始

先用一套更清楚的方式,把 AI 能力接起来

先拿一个 Key 跑通真实请求,确认模型、价格和管理方式都合适后,再慢慢扩大调用量。

无最低消费,失败请求 100% 不收费