AI API Gateway OpenAI 兼容 · 订阅转 API · 多模型统一接入

thalux

瀚海算力,启智之光,连接全球智能未来

查看文档
terminal
$ curl -X POST /v1/messages
# Routing to upstream...
200 OK { "content": "Hello!" }
$ 
订阅转 API
会话保持
按量计费
50+
已接入模型
OpenAI
兼容协议
99.99%
网关可用性
按量
透明计费
已支持的主流模型
OpenAI
Claude
Gemini
DeepSeek
Qwen
Llama
核心能力

一个平台,覆盖 AI 全生命周期

从模型调用到 Agent 编排,从知识库到多模态,thalux 把复杂度留给自己,把简单留给你。

对话大脑 · Chat Engine

基于 thalux-Pro 自研旗舰模型,支持 1M 上下文、实时联网、多轮记忆与多人格切换。相同提问下在 MMLU、HumanEval、C-Eval 三项基准综合超越同量级开源模型 14%。

1M Tokens实时联网长期记忆流式输出

多模态理解

原生支持文本、图像、语音、视频、PDF 混合输入。一次对话即可让模型看懂图、听懂话、读完百页合同。

Agent 编排

可视化拖拽构建多步骤 Agent,内置 80+ 工具与浏览器、代码解释器,一键部署到 Web / 企业微信 / 飞书。

知识库 RAG

上传 PDF、Word、飞书文档、Notion、网页链接,自动切片、向量化、混合检索。引用可溯源,答案不瞎编。

开发者 API

OpenAI 兼容协议,5 行代码无缝切换。提供 Python / Node / Go / Java SDK,支持函数调用、结构化输出、批量推理。

企业级安全

数据默认不入训,私有化部署、SSO、审计日志、SOC 2 与等保三级合规。金融/医疗场景可用。

效果可观测

内置评测集、A/B 测试、成本分析、用户反馈看板。让每一次 Prompt 迭代都能被量化。

应用场景

在你的业务里,thalux 就是那束光

从销售、客服到研发、运营 — 每一个需要智力的岗位都值得一位 AI 搭档。

7×24 小时不下线的智能客服

基于真实工单与产品手册训练,准确回答 92% 以上高频问题,转人工量下降 60%,平均响应时间从 4 分钟压缩至 3 秒。

  • 情绪识别 + 自动升级到人工
  • 多渠道接入:Web、App、微信、短信、邮件
  • 对话自动沉淀为新知识,越用越聪明
  • 管理后台一键查看满意度与 CSAT
退款流程最长要多久?
您好 👋 标准退款流程通常 1-3 个工作日到账。如选择原路退回至信用卡,银行侧还需 3-7 天。跨境订单可能延长至 10 天。
退款政策 v2.4 · §3.2 FAQ #1281
我的订单 A20250412 呢?
已为您查询:订单 A20250412 于 04-15 22:31 发起退款,预计 04-18 前到账您尾号 4721 的招商信用卡。
订单系统实时数据

把公司大脑交给团队

上传合同、手册、会议纪要、历史邮件,让每位员工都拥有"问到即答"的知识助手。回答自带引用,来源可点击跳转。

  • 支持 50+ 格式:PDF、Word、PPT、飞书、Notion、Confluence
  • 混合检索 = 向量 + 关键词 + 图谱,召回率提升 37%
  • 权限同步企业 AD / OA,越权内容看不见
  • 每月自动评测准确率,差的回答直接提醒
2025 年差旅报销上限多少?
根据最新《员工差旅与报销管理制度》:
• 经理及以下:住宿 600 元/晚、餐补 120 元/天
• 总监:住宿 900 元/晚、餐补 180 元/天
• 跨境出差另加 30% 浮动,需主管审批。
HR-002 · v3.1 (2025-03) OA 附件 §4.1
正在为您检查跨境出差特殊条款…

把重复工作交给 Agent

可视化搭建多步骤 Agent:查数据 → 做分析 → 生成报告 → 发邮件,全程无人值守。每天为团队节省 200+ 小时。

  • 80+ 内置工具:数据库、Excel、浏览器、邮件、日历
  • 自研 Planner,自动拆解复杂任务
  • 支持人工确认节点,关键动作留一个闸
  • 全程可回放、可审计
1解析需求 · "生成本周销售周报"Planner
2从 PostgreSQL 拉取销售订单数据SQL
3计算环比 / 同比 / TopN 客户Code
4生成趋势图 + 写作要点Chart
5渲染 PDF 并发送给管理层Email
完成 · 耗时 1 分 48 秒Done

为每位工程师配一位 10x 搭档

代码补全、单元测试生成、Code Review、Bug 修复 — 与 IDE 深度集成,懂你的代码库,说你的业务黑话。

  • 支持 40+ 语言,Java / Go / Python / TS 精调模型
  • 理解 Monorepo,跨文件重构也不走样
  • 自动补齐单测,覆盖率平均 +42%
  • CI 集成:PR 打开即 Review,卡关风险自动标红
thalux-suggest.py
# thalux 建议:加入指数退避与熔断,避免连续失败压垮下游
import time, random

def call_with_retry(fn, retries=3):
    for i in range(retries):
        try:
            return fn()
        except TransientError as e:
            wait = (2 ** i) + random.random()
            logger.warn(f"retry {i+1}/{retries} in {wait:.1f}s")
            time.sleep(wait)
    raise CircuitOpen("太多次失败")
开发者友好

五行代码,接入智能

与 OpenAI 协议完全兼容,SDK 覆盖主流语言,文档像工程师写给工程师的那样诚恳。

不需要迁移,只需要切换 BaseURL

thalux API 与 OpenAI Chat Completions 完全兼容,现有代码只需改一行 base_url 即可接入。

  • OpenAI 兼容 + thalux 扩展字段(RAG、Agent、工具)
  • 流式、函数调用、结构化 JSON 输出全支持
  • 按 token 精确计费,免费额度每月 100 万 tokens
  • SLA 99.99%,多区可用区容灾
阅读文档 →
quickstart.py
from openai import OpenAI

client = OpenAI(
    api_key="sk-thalux-...",
    base_url="https://api.thalux.ai/v1",
)

resp = client.chat.completions.create(
    model="thalux-pro",
    messages=[{"role": "user", "content": "用一句话解释量子纠缠"}],
    stream=True,
)

for chunk in resp:
    print(chunk.choices[0].delta.content, end="")
5ms
网关转发延迟
32+
预训练行业模型
12
全球可用区
¥0.002
起 / 1K tokens
价格透明

按需付费,零起步门槛

从个人试水到企业规模化落地,都能找到合适的那一档。

Free
¥0/ 月

给开发者和小团队一个可爱的起点。

  • 每月 100 万 tokens 免费
  • thalux-Lite 模型(128K 上下文)
  • 3 个知识库 · 5 个 Agent
  • 社区支持
立即开始
Enterprise
定制

大型企业、政府与金融场景。

  • 私有化部署 / 混合云
  • 模型微调 + 领域精调
  • SOC 2 · 等保三级合规
  • 专属 TAM + 7×24 小时 SLA
  • 审计日志 + 数据驻留可选
联系销售
客户之声

他们已经被 点亮

来自真实客户的真实反馈 — 我们把最亮的光,留给认真打磨产品的人。

"上线两周,我们的一级客服人力释放了 55%。thalux 的知识库准确率远超我们之前对接过的三家厂商。"
张晓薇
某跨境电商 · 客户体验总监
"最喜欢它的 Agent 编排 — 我的业务分析师自己就能拖出一个自动化报表机器人,不用再排队等开发。"
L
Lin Hao
NovaStar · CTO
"私有化部署只花了一个下午,文档详尽、接口规范。我们金融客户对等保三级非常认可。"
陈志远
Helix.co · 首席架构师
常见问题

你可能想知道的

thalux 和 ChatGPT、Claude 有什么区别?
thalux 是一个平台而不仅是一个模型。除了自研 thalux-Pro 基础模型之外,我们还提供知识库 RAG、Agent 编排、私有化、行业精调等一整套开箱即用的能力,帮助企业从"能聊天"走到"能落地"。
我的数据会被用来训练模型吗?
默认 不会。所有 API 与企业版的数据均不会进入训练流程。私有化部署版本数据不出内网。Pro 及以上版本可在控制台一键开关"数据协同改进"选项,由你决定。
是否支持私有化部署?
支持。提供 Kubernetes 标准化部署包、离线镜像、信创环境兼容方案,典型交付周期 2-4 周。可选 GPU 服务器托管或纯本地部署。
免费额度用完会发生什么?
不会突然中断服务。超出免费额度后会按量计费(¥0.002 / 1K tokens 起),你也可以在控制台设置 月度预算上限,到达阈值自动暂停调用,不用担心账单失控。
可以切换到其他大模型吗?
可以。平台同时支持 thalux 自研模型、Claude、GPT、通义、DeepSeek 等主流模型,同一个 Agent 可以为不同步骤指定不同模型,方便在成本和效果之间做权衡。
如何申请教育或非营利折扣?
高校师生、注册非营利组织可申请 50% 起的长期折扣。请在 联系我们 留下邮箱与证明材料,我们 3 个工作日内回复。

让你的团队,从今天开始被点亮

免费注册即送 100 万 tokens 与一对一接入咨询。无需信用卡,2 分钟完成配置。