Gateway一个入口管理主流 AI 能力

把多模型接入这件事收敛成一套更省心的接口

不用再为不同厂商分别维护账号、密钥和计费逻辑。一次接入后，就可以在qwen、kimi、deepseek之间更灵活地选择能力。

计费规则公开可见，失败请求不收费

预算、权限、IP 范围都能提前设好

兼容 OpenAI 风格调用，接入成本低

复制即用

先跑通一次真实请求，再决定后面接哪类模型

curl {API_BASE_URL}/v1/chat/completions \

-H "Authorization: Bearer $API_KEY" \

-H "Content-Type: application/json" \

-d '{"model":"qwen3.6-flash","messages":[{"role":"user","content":"Hello from Kunlun AI"}]}'

API 地址{API_BASE_URL}/

主流模型能力，一页就能看清楚

文本、多模态、图像和视频相关能力都已经整理好。你不需要先研究厂商生态，先按业务目标选方向就够了。

更适合先看懂再接入，而不是先写一堆适配代码

Qianwen

通用入口与多模态能力

覆盖对话、推理、智能体和多模态场景，适合做通用型业务入口。

#对话#推理#多模态

Kimi

长上下文与资料问答

更适合长上下文阅读、资料整理、知识问答和文档密集型任务。

#长上下文#资料#问答

DeepSeek

代码与推理性价比

适合代码、推理和高频低成本调用场景，工程侧接入也更常见。

#代码#推理#性价比

Keling

视频生成与动态创意

偏视频生成与动态内容表达，适合分镜、短片和创意视频制作。

#视频#动态#创意

Jimeng

图片生成与视觉表达

更偏图片生成与视觉创意表达，适合海报、素材和概念图产出。

#图片#视觉#创意

Zhipu

GLM 通用能力补充

GLM 系列覆盖对话、推理和多模态应用，适合做国内通用能力补充。

#对话#GLM#多模态

真正麻烦的，不是调接口，而是后面那一串管理问题

模型一多，复杂度通常不在首个请求，而在后面的维护、结算和协作。

×不同模型有不同参数和调用方式，稍微扩展一下能力，接入代码就开始散掉。

×充值、消耗和账单分散在多个平台里，成本越来越难核对，也越来越难解释。

×团队协作时最怕 Key 外泄或权限失控，很多问题不是不能用，而是不敢放开用。

先接一个入口，再慢慢扩模型

不用为了每个新模型都重搭一遍接入层。先把统一入口接好，后续扩能力会轻很多。

价格规则讲清楚，不让账单靠猜

输入、输出和按次计费都会直接展示，失败请求不收费，花在哪里也能回头查。

权限、预算和边界可以先设好

每个 Key 都能单独限制模型范围、IP、有效期和预算，避免团队一放开就失控。

用量和趋势看得见，优化才有依据

控制台能看请求、Token、消耗趋势和日志，出了问题也更容易定位与止损。

接入流程尽量做短，第一次调用不用折腾太久

先注册、再建 Key、最后把地址换进去，大多数团队都能很快跑通第一轮测试。

注册后先拿到可用额度

先进入后台，把账户和基础环境准备好，不需要先走复杂采购流程。

创建一个合适的 API Key

根据团队或项目需要配置模型权限、预算和访问限制，把边界提前设清楚。

替换地址后发出第一个请求

继续沿用 OpenAI SDK、curl 或已有工作流，把 base URL 和 Key 换掉就能测试。

我们想做的，不只是能用，而是长期也好用

首页真正想表达的不是“模型很多”，而是把接入、使用、协作和计费这几件事一起理顺。

第一次接入应该顺畅，开发者不该把时间浪费在重复适配上。

接入效率

计费必须说人话，业务、运营和采购都应该能直接看懂。

清楚算账

团队协作要能放得开，但前提是权限和风险边界足够明确。

协作可控

接入之前常问的问题，这里先说清楚

少一点模糊表述，多一点可以直接判断的信息。

我的调用数据会被留存、泄露吗？会不会用于训练？+

不会。我们按严格的数据保护思路处理调用记录，不会把你的业务数据拿去做模型训练，也不会对外泄露调用内容。

API Key 泄露了怎么办？会不会被刷爆额度？+

每个 Key 都支持预算、模型范围、IP 白名单和有效期控制，异常消耗也可以通过后台快速发现并止损。

会不会有隐藏扣费？失败请求收费吗？+

不会。价格规则直接公开展示，失败请求不收费，输入、输出和按次计费都能提前看到。

充值的余额会过期吗？有没有最低消费？+

余额永久有效，想用就用，无最低消费门槛。

先用一套更清楚的方式，把 AI 能力接起来

先拿一个 Key 跑通真实请求，确认模型、价格和管理方式都合适后，再慢慢扩大调用量。

无最低消费，失败请求 100% 不收费