POST https://geekapis.com/v1/messages 是与 Anthropic Messages API 完全兼容的原生接口,支持直接使用 Anthropic 官方 SDK(Python / JavaScript)对接,仅需将 base_url 修改为 即刻API 地址。支持流式输出(SSE)、多轮对话、系统提示词、视觉输入和工具调用。
选择接口的建议
- 若您已使用 OpenAI SDK 或希望兼容多模型,推荐使用 Chat Completions 接口。
- 若您在使用 Anthropic SDK 或 Claude Code,推荐使用本接口,可直接接入,无需修改代码结构。
鉴权
本接口支持两种认证方式,任选其一:Bearer Token 认证,适用于直接 HTTP 调用:
API Key 认证,与 Anthropic SDK 兼容:
Anthropic API 版本号。使用 Anthropic SDK 时会自动传入。推荐值:
2023-06-01。请求参数
模型名称,支持所有 Claude 系列模型,例如:
claude-opus-4-6(旗舰,复杂推理与高质量创作)claude-sonnet-4-6(性能与成本最佳平衡)claude-haiku-4-5(速度最快、成本最低)
对话消息列表,按时间先后顺序排列。只支持
user 和 assistant 角色,系统提示词请使用顶层 system 字段。生成内容的最大 token 数量。不同模型上限不同:
claude-sonnet-4-6:最大64000claude-opus-4-6:最大32000
系统提示词,在顶层设置(不要放在
messages 数组中)。支持字符串或内容块数组格式。是否启用流式输出(Server-Sent Events)。
true:逐 token 流式返回,事件格式遵循 Anthropic SSE 规范false:等待完整响应后一次性返回
采样温度,控制输出随机性。范围:
0 ~ 1。核采样概率阈值。范围:
0 ~ 1。建议不要同时设置 temperature 和 top_p。停止序列,遇到指定字符串时立即停止生成。
响应字段
本次请求的唯一标识符,格式为
msg_*。对象类型,固定为
message。响应角色,固定为
assistant。生成的内容块列表。
实际使用的模型名称。
停止原因:
end_turn:模型正常结束输出max_tokens:达到max_tokens限制stop_sequence:触发了stop_sequences中的停止序列
本次请求的 token 消耗统计。
代码示例
响应示例
200 - 成功响应
流式输出(SSE)事件格式当
stream: true 时,响应以 Anthropic SSE 规范推送,事件类型包括:message_start、content_block_start、content_block_delta、content_block_stop、message_delta、message_stop。使用 Anthropic SDK 的 stream() 方法可自动处理所有流式事件,无需手动解析。错误码
| HTTP 状态码 | 说明 | 解决方案 |
|---|---|---|
400 | 请求参数错误(如缺少 max_tokens) | 确保 model、messages、max_tokens 均已正确传入 |
401 | 身份验证失败 | 检查 Authorization 头或 x-api-key 头中的 API Key 是否有效 |
429 | 请求频率超限 | 降低并发请求数或实现退避重试策略 |
