mirror of
https://github.com/fawney19/Aether.git
synced 2026-01-02 15:52:26 +08:00
docs: 优化 README 的 Q&A 章节排版格式
This commit is contained in:
40
README.md
40
README.md
@@ -8,15 +8,14 @@
|
|||||||
<strong>开源 AI API 网关</strong><br>
|
<strong>开源 AI API 网关</strong><br>
|
||||||
支持 Claude / OpenAI / Gemini 及其 CLI 客户端的统一接入层
|
支持 Claude / OpenAI / Gemini 及其 CLI 客户端的统一接入层
|
||||||
</p>
|
</p>
|
||||||
|
|
||||||
<p align="center">
|
<p align="center">
|
||||||
<a href="#特性">特性</a> •
|
<a href="#简介">简介</a> •
|
||||||
<a href="#架构">架构</a> •
|
|
||||||
<a href="#部署">部署</a> •
|
<a href="#部署">部署</a> •
|
||||||
<a href="#环境变量">环境变量</a> •
|
<a href="#环境变量">环境变量</a> •
|
||||||
<a href="#qa">Q&A</a>
|
<a href="#qa">Q&A</a>
|
||||||
</p>
|
</p>
|
||||||
|
|
||||||
|
|
||||||
---
|
---
|
||||||
|
|
||||||
## 简介
|
## 简介
|
||||||
@@ -105,33 +104,38 @@ cd frontend && npm install && npm run dev
|
|||||||
|
|
||||||
### Q: 如何开启/关闭请求体记录?
|
### Q: 如何开启/关闭请求体记录?
|
||||||
|
|
||||||
1. 管理员在系统设置中, 设置日志记录的记录详细程度.
|
管理员在 **系统设置** 中配置日志记录的详细程度:
|
||||||
|
|
||||||
- Base: 基本请求信息。
|
| 级别 | 记录内容 |
|
||||||
- Headers: Base + 请求头。
|
|------|----------|
|
||||||
- Full: Base + 请求头 + 请求体。
|
| Base | 基本请求信息 |
|
||||||
|
| Headers | Base + 请求头 |
|
||||||
|
| Full | Headers + 请求体 |
|
||||||
|
|
||||||
### Q: 管理员如何给模型配置1M上下文 / 1H缓存 能力支持?
|
### Q: 管理员如何给模型配置 1M上下文 / 1H缓存 能力支持?
|
||||||
|
|
||||||
1. 在模型管理中, 给模型设置1M上下文 / 1H缓存的能力支持, 并配置好价格.
|
1. **模型管理**: 给模型设置 1M上下文 / 1H缓存 的能力支持, 并配置好价格
|
||||||
2. 在提供商管理中, 给端点添加支持1M上下文 / 1H缓存的能力的密钥并勾选1M上下文 / 1H缓存能里标签.
|
2. **提供商管理**: 给端点添加支持该能力的密钥, 并勾选对应的能力标签
|
||||||
|
|
||||||
### Q: 用户如何使用1H缓存?
|
### Q: 用户如何使用 1H缓存?
|
||||||
|
|
||||||
1. 用户在管理管理中针对指定模型使用1H缓存策略, 或者在密钥管理中针对指定密钥使用1H缓存策略.
|
- **模型级别**: 在模型管理中针对指定模型开启 1H缓存策略
|
||||||
注意: 用户若对密钥设置强制1H缓存, 则该密钥只能使用支持1H缓存的模型.
|
- **密钥级别**: 在密钥管理中针对指定密钥使用 1H缓存策略
|
||||||
|
|
||||||
|
> **注意**: 若对密钥设置强制 1H缓存, 则该密钥只能调用支持 1H缓存的模型
|
||||||
|
|
||||||
### Q: 如何配置负载均衡?
|
### Q: 如何配置负载均衡?
|
||||||
|
|
||||||
在管理后台「提供商管理中」中切换调度模式,系统提供两种调度策略:
|
在管理后台 **提供商管理** 中切换调度模式:
|
||||||
|
|
||||||
1. **提供商优先 (provider)**:按 Provider 优先级排序,同优先级内按 Key 的内部优先级排序,相同优先级通过哈希分散实现负载均衡。适合希望优先使用特定供应商的场景。
|
| 模式 | 说明 | 适用场景 |
|
||||||
|
|------|------|----------|
|
||||||
2. **全局 Key 优先 (global_key)**:忽略 Provider 层级,所有 Key 按全局优先级统一排序,相同优先级通过哈希分散实现负载均衡。适合跨 Provider 统一调度、最大化利用所有 Key 的场景。
|
| **提供商优先** | 按 Provider 优先级排序, 同优先级内按 Key 优先级排序, 相同优先级哈希分散 | 优先使用特定供应商 |
|
||||||
|
| **全局 Key 优先** | 忽略 Provider 层级, 所有 Key 按全局优先级统一排序, 相同优先级哈希分散 | 跨 Provider 统一调度, 最大化利用所有 Key |
|
||||||
|
|
||||||
### Q: 提供商免费套餐的计费模式会计入成本吗?
|
### Q: 提供商免费套餐的计费模式会计入成本吗?
|
||||||
|
|
||||||
免费套餐的计费模式, 可以视作倍率为0, 因此产生的记录不会计入倍率费用。
|
> **不会**。免费套餐的计费模式倍率为 0, 产生的记录不计入成本费用。
|
||||||
|
|
||||||
---
|
---
|
||||||
|
|
||||||
|
|||||||
Reference in New Issue
Block a user