客户端接入
当本地客户端或 SDK 需要填写 base URL、API key、model、endpoint 或 streaming 设置时,看本页。
- 1启动 ProxAI使用你的运行时配置启动本地代理。
- 2设置 base URL让客户端指向本地 Proxy listener,而不是上游 provider。
- 3选择 endpoint请求 path 决定入站协议。
- 4使用模型名路由先匹配客户端发送的模型,再可选改写 upstream_model。
- 5发送小请求在使用工具或大 prompt 前,先验证路由和错误格式。
Base URL 与 endpoints
Section titled “Base URL 与 endpoints”| 客户端 endpoint | 入站协议 | 使用场景 |
|---|---|---|
/v1/responses 或 /responses | openai_responses | 客户端支持 OpenAI Responses 语义。 |
/v1/chat/completions 或 /chat/completions | openai_chat_completions | 客户端期望 Chat Completions choices[]。 |
/v1/messages 或 /messages | anthropic_messages | 客户端发送 Anthropic Messages payload。 |
API keys
Section titled “API keys”| 位置 | 值 | 效果 |
|---|---|---|
| 客户端 UI 或 SDK | 如果必填,可以用任意本地占位值 | 满足客户端要求;不控制上游 provider 认证。 |
providers.<name>.api_key | 真实上游 provider key | 按 provider 协议认证头发送给上游。 |
| 环境变量 | 仅当你的启动器把它注入配置或 CLI 时有效 | ProxAI 不要求客户端发送 provider secret。 |
精确认证行为见行为契约。
模型名与路由
Section titled “模型名与路由”客户端发送的模型会先被匹配,然后才做 provider model rewrite:
[[routing.routes]]request_protocol = "openai_chat_completions"match_kind = "exact"model_pattern = "MiniMax-M3-preview"provider = "minimax"upstream_model = "MiniMax-M3"model_pattern匹配客户端发送的值。provider选择上游配置。upstream_model是 ProxAI 发给 provider 的模型名。
详见路由与 Provider 和路由匹配。
交互式调试优先使用可读 text;SDK 期望结构化错误时使用 JSON:
[error_responses]format = "json"见错误响应。
流式客户端应预期协议专属终止信号:
| 协议 | 终止信号 |
|---|---|
| OpenAI Responses | response.completed |
| OpenAI Chat Completions | [DONE] |
| Anthropic Messages | message_stop |
如果工具调用参数已经开始但 stream 卡住,检查 [tool_calls].timeout_secs。见流式行为。