你自己的单一登入,加上按团队划分的访问控制。用你早已信任的 OIDC 身份登入;每个成员、每把金钥、每支 agent 都限定在所属团队内。
2026 年要做 AI 的团队,最后都在做同样这五件事。
身份。安全连线。调度。审计。封装。这五件 Cloud 都做完了 — 让团队写的工作流与服务底下有一层平台撑着,而不是一堆胶水代码。
穿过任何防火墙连到一张 GPU,只靠一条对外连线 — 不必开任何 inbound 端口。同一条隧道还能跑 HTTP、原生 TCP,需要时直接给你一条远端画面通道看进机器里。
工作按标签落到对的机器上,每个团队各持自己的配额,进度即时回传。算力不够?随需溢出到外部算力。
每个结果都能追回到产生它的那次执行,Cloud 发出的 webhook 都经过加密签名,你的系统能放心信任。
工作流、自订节点、模型 — 上传一次,Cloud 把它们分发到整支舰队、为每个版本留快照,并只把输入参数露给 API 消费者,内部细节藏起来。
拥有自己算力、在乎掌控权的团队。
Cloud 是为那些不能把资料放到别人 GPU 上、而且早就不再假装这是少数特例的团队设计的。
影视制作 / 媒体团队
把 50 人团队怎么用 AI 这件事标准化,让内部管线生产化。给每个客户一把 API 金钥,只露输入、绝不露内部细节 — IP 留在自家 GPU。
AI 服务供应商
不必转租 GPU,也能把 AI 能力卖给合作伙伴。Cloud 帮你隔离每个合作方、把他们的工作路由到对的机器上,并为每个回调签名让他们能信任。
企业内部 AI 平台
给工程师一条铺好的路 — 不必每个团队各自堆一份工作流 runtime 才能开始做 AI 功能。
受监管的行业
金融、制造、政府。可跑在 On-Prem 或全气隙环境,授权绑定你的硬件,不需要任何对外回连。
一套代码。三种信任边界。
同一份 Cloud — 身份、调度器、安全连线、封装 — 跑成托管 SaaS、跑进你的 Kubernetes,或气隙在你的防火墙之后。边界跟着你的需求走,不是你跟边界走。
托管 SaaS
控制面与 dashboard 由我们托管,你只带 GPU 进来。投产最快的一条路径。
- 我们托管平台 + Gateway
- 你只装 agent
- 每租户资料隔离
- 我们的 SLA、我们的补丁
On-Prem Kubernetes
整套 stack 部署到你自己的 Kubernetes 集群。GitOps 原生 — 宣告式 manifest,没有客制 installer。
- 你的集群、你的钥匙
- 每集群独立授权
- Operator 管理的资料层
- 标准 ingress
气隙友善部署
为没有 internet egress 的网络设计。授权绑定你的硬件、全程离线验证。
- 离线加密签名授权
- 硬件指纹绑定
- Lease-token 缓存
- 无 phone-home
Cloud 实际怎么接起来。
三层架构:Surface、控制平面、算力。控制平面交给你部署,或交给我们托管。
Cloud 会讲 MCP。你的 AI 代理已经知道怎么呼叫它。
支撑 Cyberun 后台的那个编排器,同时也是一台 MCP server。用一把 integration key 把你的 AI 客户端指向同一个 endpoint,它就能驱动你的 workflows、tasks、agents 与 container services — 一共十四个工具。
- Endpoint
- https://core.cyberun.cloud/api/v1/mcp
- 认证标头
- Authorization: Bearer sk-…
- 传输
- Streamable HTTP
十四个工具,覆盖四个面。
每个 MCP 工具都自动 scope 到 credential 所属的 team。AI agent 自己挑工具 — 你不必逐次手接。
Workflows
list_workflows · get_workflow · get_workflow_by_slug · presign_file_upload — agent 发现可用工作流并取得参数 schema,再送任务。
Tasks
run_workflow · list_tasks · get_task · get_task_result · stream_task_events · cancel_task — 送任务、用 MCP notifications/progress 追进度、完成后拉 artifact。
Agents 与 container services
list_agents · list_container_services · get_container_service · call_container_service — 看哪些 agent 在线,呼叫团队部署的任何 HTTP service。
团队的服务,也变成 AI 能力。
把 Ollama、vLLM、自家 Flask 应用部署成长跑的 container service。写一行 usage_prompt 告诉 AI 怎么用。任何 MCP client 里的 agent 都能发现服务、读 prompt、透过 call_container_service 呼叫 — 不必额外接线,不必第二次整合。
vLLM · Ollama · Whisper · SAM · custom FastAPI · brand checkers · internal model routers
一把 credential。Workflows 与 container services 在同一个 agent 回路里。
安装 Cyberun skill
一行指令就把 API + MCP 的版图教给 Claude Code、Cursor、Windsurf 或 Codex CLI。装完之后直接问:「帮我用 text-to-image 工作流提交一个 Cyberun 任务。」代理会自动挑路径、补 header、引用正确的 endpoint。
$ npx skills add cyberun-cloud/skills算力可替换。产品不必。
Agent 不是一支特定程序 — 是一份通讯协议。任何会讲这份协议的东西,从 Cloud 调度器的角度看,都是一支可调度的舰队。这就是赌一家供应商,跟赌一层 — 之间的差别。
今天的 agent 是一支精巧的 Go 二进制,丢到你自己拥有的 GPU 上就行 — On-Prem、桌下的一台工作站,或租来的机器。它执行 ComfyUI 工作流、Nerfstudio 管线、长跑的服务,用一条对外连线拨向 Cloud,所以没有任何 inbound 要开。
未来的 agent 是任何会讲这份协议的东西。包一层外部 GPU 供应商、serverless 推理平台、或另一支团队的舰队 — Cloud 看到的就是另一组 agent。同一组调度逻辑、同一组身份、同一组账单。
你绑定的是编排器,不是算力供应商。底下市场怎么变 — 谁便宜、谁缺货、谁端出新 GPU — 你不需要换平台。我们换 fleet。
Agents dial out — no inbound ports. Cloud routes between clients and agents.
气隙部署真正需要什么。
多数 AI 工具假设模型 API 一次 HTTPS 就能调用到。受监管、机密、On-Prem 那些房间不能。Cloud 是为那种房间从一开始就设计好的,不是后来再硬塞进去。
没有网络也能跑好几天。一份签名的 lease-token 缓存让部署在离线时照常运作,网络恢复时再用 challenge-response 重新认证。对外回连从来不是硬性条件。
绑定在安装它的那台机器上。授权绑定主机指纹;换机部署就重新签一次。这能挡掉某份拷贝在受监管组织内部悄悄横向扩散。
不开 inbound 洞也能连进去。四种隧道模式 — HTTP、TCP、WebSocket、WebRTC — 全部跑在一条对外连线上,所以 inbound 路径走得通,又不必在防火墙上打洞。
对外的 AI 调用仍在你手上。当工作流真的去调用公开 AI 供应商时,请求会做端到端签名 — 所以你可以在 relay 层撤销,不必只靠供应商那一端。
跨租户访问不是靠审计挡掉的 — 在设计上就不可能。访问限定在每个团队自己的域内,所以一个租户根本碰不到另一个。
基本功是默认就有、不拿来吹的:身份 token 搭 OIDC 撤销做轮换、凭证静态加密、内外 API 分开。我们不把基本盘当成卖点。
一种范围、一种用途、一次 revoke。
Cyberun 发三种 credential,每种都用前缀标示用途。掉了其中一把,撤销那把就好 — 其他的继续运作。
通用型 API 金钥。脚本、CI、合作方整合、MCP client(Claude Code、Cursor)都用 sk-。范围限定在一个 team。
Agent 程序连进 team 算力池时使用。仅限 agent runtime — 不能读 dashboard、也不能代替成员提交任务。
成员透过 cyberun CLI 配对设备时发出。绑使用者、限定 team。笔电不见了?管理者撤销那张 device key — 使用者其他存取不受影响。
我们最常听到的用例。
Cloud 是围绕这些模式塑形出来的。你的需求多半属于其中一种。
工作室内部 AI 平台
让你 200 人的美术团队用统一方式跑生成工具。每个 clip 都能追回到当初的工作流与 seed。
合作方产品里的 AI 功能
上传你的工作流一次 — ComfyUI 工作流、Nerfstudio 管线,或 container service 都行。给合作方一把 API 金钥,只露输入、藏起内部细节,按他们的用量计费。
主权 AI 算力
On-Prem 部署在你的气隙机房。Cloud 是控制平面,资料永远不离开你的网络。
从一台工作站到一整支舰队
你买了一台 DGX。然后两台。后面又加了裸机 GPU server、再插几个云租实例进来。Cyberun 把它们聚成同一支团队舰队 — 模型与自订节点在每台机器间自动同步、MCP 给任何 AI 客户端一个统一界面来操作、gateway tunnel 让你 debug 某台机器时不必逐台开 port。
开始上手
sales@cyberun.cloud