diff --git a/README.md b/README.md index 2e3f5c1..6b2f28d 100644 --- a/README.md +++ b/README.md @@ -8,15 +8,14 @@ 开源 AI API 网关
支持 Claude / OpenAI / Gemini 及其 CLI 客户端的统一接入层

-

- 特性 • - 架构 • + 简介部署环境变量Q&A

+ --- ## 简介 @@ -105,33 +104,38 @@ cd frontend && npm install && npm run dev ### Q: 如何开启/关闭请求体记录? -1. 管理员在系统设置中, 设置日志记录的记录详细程度. +管理员在 **系统设置** 中配置日志记录的详细程度: -- Base: 基本请求信息。 -- Headers: Base + 请求头。 -- Full: Base + 请求头 + 请求体。 +| 级别 | 记录内容 | +|------|----------| +| Base | 基本请求信息 | +| Headers | Base + 请求头 | +| Full | Headers + 请求体 | -### Q: 管理员如何给模型配置1M上下文 / 1H缓存 能力支持? +### Q: 管理员如何给模型配置 1M上下文 / 1H缓存 能力支持? -1. 在模型管理中, 给模型设置1M上下文 / 1H缓存的能力支持, 并配置好价格. -2. 在提供商管理中, 给端点添加支持1M上下文 / 1H缓存的能力的密钥并勾选1M上下文 / 1H缓存能里标签. +1. **模型管理**: 给模型设置 1M上下文 / 1H缓存 的能力支持, 并配置好价格 +2. **提供商管理**: 给端点添加支持该能力的密钥, 并勾选对应的能力标签 -### Q: 用户如何使用1H缓存? +### Q: 用户如何使用 1H缓存? -1. 用户在管理管理中针对指定模型使用1H缓存策略, 或者在密钥管理中针对指定密钥使用1H缓存策略. -注意: 用户若对密钥设置强制1H缓存, 则该密钥只能使用支持1H缓存的模型. +- **模型级别**: 在模型管理中针对指定模型开启 1H缓存策略 +- **密钥级别**: 在密钥管理中针对指定密钥使用 1H缓存策略 + +> **注意**: 若对密钥设置强制 1H缓存, 则该密钥只能调用支持 1H缓存的模型 ### Q: 如何配置负载均衡? -在管理后台「提供商管理中」中切换调度模式,系统提供两种调度策略: +在管理后台 **提供商管理** 中切换调度模式: -1. **提供商优先 (provider)**:按 Provider 优先级排序,同优先级内按 Key 的内部优先级排序,相同优先级通过哈希分散实现负载均衡。适合希望优先使用特定供应商的场景。 - -2. **全局 Key 优先 (global_key)**:忽略 Provider 层级,所有 Key 按全局优先级统一排序,相同优先级通过哈希分散实现负载均衡。适合跨 Provider 统一调度、最大化利用所有 Key 的场景。 +| 模式 | 说明 | 适用场景 | +|------|------|----------| +| **提供商优先** | 按 Provider 优先级排序, 同优先级内按 Key 优先级排序, 相同优先级哈希分散 | 优先使用特定供应商 | +| **全局 Key 优先** | 忽略 Provider 层级, 所有 Key 按全局优先级统一排序, 相同优先级哈希分散 | 跨 Provider 统一调度, 最大化利用所有 Key | ### Q: 提供商免费套餐的计费模式会计入成本吗? -免费套餐的计费模式, 可以视作倍率为0, 因此产生的记录不会计入倍率费用。 +> **不会**。免费套餐的计费模式倍率为 0, 产生的记录不计入成本费用。 ---