mirror of
https://github.com/fawney19/Aether.git
synced 2026-01-02 15:52:26 +08:00
docs: 优化 README 的 Q&A 章节排版格式
This commit is contained in:
40
README.md
40
README.md
@@ -8,15 +8,14 @@
|
||||
<strong>开源 AI API 网关</strong><br>
|
||||
支持 Claude / OpenAI / Gemini 及其 CLI 客户端的统一接入层
|
||||
</p>
|
||||
|
||||
<p align="center">
|
||||
<a href="#特性">特性</a> •
|
||||
<a href="#架构">架构</a> •
|
||||
<a href="#简介">简介</a> •
|
||||
<a href="#部署">部署</a> •
|
||||
<a href="#环境变量">环境变量</a> •
|
||||
<a href="#qa">Q&A</a>
|
||||
</p>
|
||||
|
||||
|
||||
---
|
||||
|
||||
## 简介
|
||||
@@ -105,33 +104,38 @@ cd frontend && npm install && npm run dev
|
||||
|
||||
### Q: 如何开启/关闭请求体记录?
|
||||
|
||||
1. 管理员在系统设置中, 设置日志记录的记录详细程度.
|
||||
管理员在 **系统设置** 中配置日志记录的详细程度:
|
||||
|
||||
- Base: 基本请求信息。
|
||||
- Headers: Base + 请求头。
|
||||
- Full: Base + 请求头 + 请求体。
|
||||
| 级别 | 记录内容 |
|
||||
|------|----------|
|
||||
| Base | 基本请求信息 |
|
||||
| Headers | Base + 请求头 |
|
||||
| Full | Headers + 请求体 |
|
||||
|
||||
### Q: 管理员如何给模型配置1M上下文 / 1H缓存 能力支持?
|
||||
### Q: 管理员如何给模型配置 1M上下文 / 1H缓存 能力支持?
|
||||
|
||||
1. 在模型管理中, 给模型设置1M上下文 / 1H缓存的能力支持, 并配置好价格.
|
||||
2. 在提供商管理中, 给端点添加支持1M上下文 / 1H缓存的能力的密钥并勾选1M上下文 / 1H缓存能里标签.
|
||||
1. **模型管理**: 给模型设置 1M上下文 / 1H缓存 的能力支持, 并配置好价格
|
||||
2. **提供商管理**: 给端点添加支持该能力的密钥, 并勾选对应的能力标签
|
||||
|
||||
### Q: 用户如何使用1H缓存?
|
||||
### Q: 用户如何使用 1H缓存?
|
||||
|
||||
1. 用户在管理管理中针对指定模型使用1H缓存策略, 或者在密钥管理中针对指定密钥使用1H缓存策略.
|
||||
注意: 用户若对密钥设置强制1H缓存, 则该密钥只能使用支持1H缓存的模型.
|
||||
- **模型级别**: 在模型管理中针对指定模型开启 1H缓存策略
|
||||
- **密钥级别**: 在密钥管理中针对指定密钥使用 1H缓存策略
|
||||
|
||||
> **注意**: 若对密钥设置强制 1H缓存, 则该密钥只能调用支持 1H缓存的模型
|
||||
|
||||
### Q: 如何配置负载均衡?
|
||||
|
||||
在管理后台「提供商管理中」中切换调度模式,系统提供两种调度策略:
|
||||
在管理后台 **提供商管理** 中切换调度模式:
|
||||
|
||||
1. **提供商优先 (provider)**:按 Provider 优先级排序,同优先级内按 Key 的内部优先级排序,相同优先级通过哈希分散实现负载均衡。适合希望优先使用特定供应商的场景。
|
||||
|
||||
2. **全局 Key 优先 (global_key)**:忽略 Provider 层级,所有 Key 按全局优先级统一排序,相同优先级通过哈希分散实现负载均衡。适合跨 Provider 统一调度、最大化利用所有 Key 的场景。
|
||||
| 模式 | 说明 | 适用场景 |
|
||||
|------|------|----------|
|
||||
| **提供商优先** | 按 Provider 优先级排序, 同优先级内按 Key 优先级排序, 相同优先级哈希分散 | 优先使用特定供应商 |
|
||||
| **全局 Key 优先** | 忽略 Provider 层级, 所有 Key 按全局优先级统一排序, 相同优先级哈希分散 | 跨 Provider 统一调度, 最大化利用所有 Key |
|
||||
|
||||
### Q: 提供商免费套餐的计费模式会计入成本吗?
|
||||
|
||||
免费套餐的计费模式, 可以视作倍率为0, 因此产生的记录不会计入倍率费用。
|
||||
> **不会**。免费套餐的计费模式倍率为 0, 产生的记录不计入成本费用。
|
||||
|
||||
---
|
||||
|
||||
|
||||
Reference in New Issue
Block a user