客户端接入

当本地客户端或 SDK 需要填写 base URL、API key、model、endpoint 或 streaming 设置时，看本页。

接入流程

1启动 ProxAI使用你的运行时配置启动本地代理。
2设置 base URL让客户端指向本地 Proxy listener，而不是上游 provider。
3选择 endpoint请求 path 决定入站协议。
4使用模型名路由先匹配客户端发送的模型，再可选改写 upstream_model。
5发送小请求在使用工具或大 prompt 前，先验证路由和错误格式。

Base URL 与 endpoints

客户端 endpoint	入站协议	使用场景
`/v1/responses` 或 `/responses`	`openai_responses`	客户端支持 OpenAI Responses 语义。
`/v1/chat/completions` 或 `/chat/completions`	`openai_chat_completions`	客户端期望 Chat Completions `choices[]`。
`/v1/messages` 或 `/messages`	`anthropic_messages`	客户端发送 Anthropic Messages payload。

API keys

位置	值	效果
客户端 UI 或 SDK	如果必填，可以用任意本地占位值	满足客户端要求；不控制上游 provider 认证。
`providers.<name>.api_key`	真实上游 provider key	按 provider 协议认证头发送给上游。
环境变量	仅当你的启动器把它注入配置或 CLI 时有效	ProxAI 不要求客户端发送 provider secret。

精确认证行为见行为契约。

模型名与路由

客户端发送的模型会先被匹配，然后才做 provider model rewrite：

[[routing.routes]]
request_protocol = "openai_chat_completions"
match_kind = "exact"
model_pattern = "MiniMax-M3-preview"
provider = "minimax"
upstream_model = "MiniMax-M3"

model_pattern 匹配客户端发送的值。
provider 选择上游配置。
upstream_model 是 ProxAI 发给 provider 的模型名。

详见路由与 Provider 和路由匹配。

错误格式

交互式调试优先使用可读 text；SDK 期望结构化错误时使用 JSON：

[error_responses]
format = "json"

见错误响应。

流式客户端

流式客户端应预期协议专属终止信号：

协议	终止信号
OpenAI Responses	`response.completed`
OpenAI Chat Completions	`[DONE]`
Anthropic Messages	`message_stop`

如果工具调用参数已经开始但 stream 卡住，检查 [tool_calls].timeout_secs。见流式行为。

后续页面

快速开始首次本地运行和配置。如何选择协议决定入站协议和 provider 协议。常见排障症状、可能原因和下一步检查。CLI 参考Flags、route overrides 和 capture commands。