Skip to content

常见问题解答(FAQ) - 模型服务平台


1. 认证与权限

Q1: 如何获取 API 密钥?

A: 登录平台控制台 → 进入 "API Keys" 页面 → 点击 "创建密钥",生成后请妥善保存(如 sk-xxx...)。

Q2: API 密钥有权限控制吗?

A: 支持基于角色的权限管理。例如,可为不同团队分配只读密钥或全功能密钥(需联系客服配置)。

Q3: 密钥泄露了怎么办?

A: 立即在控制台 "API Keys" 页面删除旧密钥并生成新密钥,并检查历史调用记录是否有异常。


2. API 调用问题

Q4: API 请求必须使用 HTTPS 吗?

A: 是的,所有请求必须通过 HTTPS 加密传输以确保安全性。

Q5: 如何测试 API 是否可用?

A: 可通过以下命令测试连通性:

bash
curl -v https://api.edgefn.net/v1/models

返回 200 OK 表示服务正常。

Q6: 请求参数大小有限制吗?

A:

  • Embedding: 单次输入文本长度不超过 2048 tokens。
  • LLM: 输入 + 输出总长度不超过模型最大上下文(如 GPT-3.5 Turbo 为 4096 tokens)。
    超出限制会返回 400 Bad Request

3. 模型相关

Q7: 支持哪些模型?

A: 详见 模型广场,包括:

  • Embedding: BAAI/bge-m3
  • LLM: DeepSeek-R1-0528DeepSeek-R1-0528-Qwen3-8B

Q8: 如何选择合适的模型?

A:

  • Embedding: 通用场景推荐 BAAI/bge-m3,低延迟场景选轻量模型。
  • LLM: 高精度对话用 DeepSeek-R1-0528,成本敏感场景用 DeepSeek-R1-0528-Qwen3-8B

Q9: 模型支持哪些语言?

A: 主流模型均支持 中文、英文,部分模型支持多语言(如 gpt-4 支持 100+ 种语言)。


4. 错误处理

Q10: 返回 401 Unauthorized 怎么办?

A: 检查 API 密钥是否正确、是否过期,或请求头中是否遗漏 Authorization 字段。

Q11: 返回 429 Too Many Requests 怎么办?

A: 已达到调用频率限制。解决方案:

  • 增加请求间隔时间
  • 升级账户套餐(联系客服)

Q12: 返回 503 Service Unavailable 怎么办?

A: 平台临时过载,请稍后重试。若持续出现,联系技术支持。


5. 费用与计费

Q13: 调用如何计费?

A:

  • Embedding: 按输入文本的 token 数量计费。
  • LLM: 按输入 + 输出的 token 数量计费。

Q14: 如何查看调用记录和费用?

A: 登录控制台,可查看实时调用量、费用明细及历史记录。

Q15: 有免费额度吗?

A: 新用户注册,并完成实名认证后自动获得 50 元试用额度(有效期内),可直接用于 API 调用。


6. 安全与合规

Q16: 数据隐私如何保障?

A: 请查看 隐私政策

Q17: 用户协议有哪些内容?

A: 请查看 用户协议


7. 性能优化

Q18: 如何降低调用延迟?

A:

  • 选择离您最近的接入点(如提供多区域部署)。
  • 批量处理文本(如一次请求传入多段文本)。
  • 调整模型参数(如减少 max_tokens)。

Q19: 如何提高生成质量?

A:

  • 通过 temperature 参数控制随机性(0.0~1.0,值越低越稳定)。
  • 使用清晰明确的提示词(Prompt Engineering)。
  • 对于 LLM,增加 top_pfrequency_penalty 参数优化输出。

8. 其他问题

Q20: 可以自定义模型吗?

A: 支持定制化微调模型(需提供训练数据和需求,联系客服咨询具体流程)。

Q21: 如何联系技术支持?

A: 邮件发送至 ai-bd@baishan.com,或通过控制台提交工单。


贵州白山云科技