跳转到内容

客户端接入

当本地客户端或 SDK 需要填写 base URL、API key、model、endpoint 或 streaming 设置时,看本页。

  1. 1启动 ProxAI使用你的运行时配置启动本地代理。
  2. 2设置 base URL让客户端指向本地 Proxy listener,而不是上游 provider。
  3. 3选择 endpoint请求 path 决定入站协议。
  4. 4使用模型名路由先匹配客户端发送的模型,再可选改写 upstream_model。
  5. 5发送小请求在使用工具或大 prompt 前,先验证路由和错误格式。
客户端 endpoint入站协议使用场景
/v1/responses/responsesopenai_responses客户端支持 OpenAI Responses 语义。
/v1/chat/completions/chat/completionsopenai_chat_completions客户端期望 Chat Completions choices[]
/v1/messages/messagesanthropic_messages客户端发送 Anthropic Messages payload。
位置效果
客户端 UI 或 SDK如果必填,可以用任意本地占位值满足客户端要求;不控制上游 provider 认证。
providers.<name>.api_key真实上游 provider key按 provider 协议认证头发送给上游。
环境变量仅当你的启动器把它注入配置或 CLI 时有效ProxAI 不要求客户端发送 provider secret。

精确认证行为见行为契约

客户端发送的模型会先被匹配,然后才做 provider model rewrite:

[[routing.routes]]
request_protocol = "openai_chat_completions"
match_kind = "exact"
model_pattern = "MiniMax-M3-preview"
provider = "minimax"
upstream_model = "MiniMax-M3"
  • model_pattern 匹配客户端发送的值。
  • provider 选择上游配置。
  • upstream_model 是 ProxAI 发给 provider 的模型名。

详见路由与 Provider路由匹配

交互式调试优先使用可读 text;SDK 期望结构化错误时使用 JSON:

[error_responses]
format = "json"

错误响应

流式客户端应预期协议专属终止信号:

协议终止信号
OpenAI Responsesresponse.completed
OpenAI Chat Completions[DONE]
Anthropic Messagesmessage_stop

如果工具调用参数已经开始但 stream 卡住,检查 [tool_calls].timeout_secs。见流式行为