常见问题解答(FAQ) - 模型服务平台
1. 认证与权限
Q1: 如何获取 API 密钥?
A: 登录平台控制台 → 进入 "API Keys" 页面 → 点击 "创建密钥",生成后请妥善保存(如 sk-xxx...)。
Q2: API 密钥有权限控制吗?
A: 支持基于角色的权限管理。例如,可为不同团队分配只读密钥或全功能密钥(需联系客服配置)。
Q3: 密钥泄露了怎么办?
A: 立即在控制台 "API Keys" 页面删除旧密钥并生成新密钥,并检查历史调用记录是否有异常。
2. API 调用问题
Q4: API 请求必须使用 HTTPS 吗?
A: 是的,所有请求必须通过 HTTPS 加密传输以确保安全性。
Q5: 如何测试 API 是否可用?
A: 可通过以下命令测试连通性:
bash
curl -v https://api.edgefn.net/v1/models返回 200 OK 表示服务正常。
Q6: 请求参数大小有限制吗?
A:
- Embedding: 单次输入文本长度不超过 2048 tokens。
- LLM: 输入 + 输出总长度不超过模型最大上下文(如 GPT-3.5 Turbo 为 4096 tokens)。
超出限制会返回400 Bad Request。
3. 模型相关
Q7: 支持哪些模型?
A: 详见 模型广场,包括:
- Embedding:
BAAI/bge-m3 - LLM:
DeepSeek-R1-0528、DeepSeek-R1-0528-Qwen3-8B等
Q8: 如何选择合适的模型?
A:
- Embedding: 通用场景推荐
BAAI/bge-m3,低延迟场景选轻量模型。 - LLM: 高精度对话用
DeepSeek-R1-0528,成本敏感场景用DeepSeek-R1-0528-Qwen3-8B。
Q9: 模型支持哪些语言?
A: 主流模型均支持 中文、英文,部分模型支持多语言(如 gpt-4 支持 100+ 种语言)。
4. 错误处理
Q10: 返回 401 Unauthorized 怎么办?
A: 检查 API 密钥是否正确、是否过期,或请求头中是否遗漏 Authorization 字段。
Q11: 返回 429 Too Many Requests 怎么办?
A: 已达到调用频率限制。解决方案:
- 增加请求间隔时间
- 升级账户套餐(联系客服)
Q12: 返回 503 Service Unavailable 怎么办?
A: 平台临时过载,请稍后重试。若持续出现,联系技术支持。
5. 费用与计费
Q13: 调用如何计费?
A:
- Embedding: 按输入文本的 token 数量计费。
- LLM: 按输入 + 输出的 token 数量计费。
Q14: 如何查看调用记录和费用?
A: 登录控制台,可查看实时调用量、费用明细及历史记录。
Q15: 有免费额度吗?
A: 新用户注册,并完成实名认证后自动获得 50 元试用额度(有效期内),可直接用于 API 调用。
6. 安全与合规
Q16: 数据隐私如何保障?
A: 请查看 隐私政策。
Q17: 用户协议有哪些内容?
A: 请查看 用户协议。
7. 性能优化
Q18: 如何降低调用延迟?
A:
- 选择离您最近的接入点(如提供多区域部署)。
- 批量处理文本(如一次请求传入多段文本)。
- 调整模型参数(如减少
max_tokens)。
Q19: 如何提高生成质量?
A:
- 通过
temperature参数控制随机性(0.0~1.0,值越低越稳定)。 - 使用清晰明确的提示词(Prompt Engineering)。
- 对于 LLM,增加
top_p或frequency_penalty参数优化输出。
8. 其他问题
Q20: 可以自定义模型吗?
A: 支持定制化微调模型(需提供训练数据和需求,联系客服咨询具体流程)。
Q21: 如何联系技术支持?
A: 邮件发送至 ai-bd@baishan.com,或通过控制台提交工单。
