LLM模型服务平台API文档(v2.0)
1. 产品概述
本平台提供大语言模型服务,支持自然语言理解、文本生成、代码生成等场景。
支持模型列表
| 模型名称 | 上架时间 | 类别 |
|---|---|---|
| Qwen3-32B-FP8 | 2025/6/9 | 通用大语言模型 |
| Qwen3-30B-A3B-FP8 | 2025/6/9 | 通用大语言模型 |
| DeepSeek-R1-0528-Qwen3-8B | 2025/6/9 | 蒸馏模型 |
| DeepSeek-R1-0528 | 2025/6/9 | 通用大语言模型 |
| BAAl/bge-m3 | 2025/6/22 | 检索增强模型 (Embedding) |
| bge-reranker-v2-m3 | 2025/7/2 | 重排序模型 (Reranker) |
| Qwen3-Reranker-8B | 2025/7/2 | 重排序模型 (Reranker) |
| Qwen3-Reranker-4B | 2025/7/2 | 重排序模型 (Reranker) |
| Qwen3-Reranker-0.6B | 2025/7/2 | 重排序模型 (Reranker) |
| DeepSeek-V3 | 2025/7/3 | 通用大语言模型 |
| Qwen3-235B-A22B | 2025/7/3 | 通用大语言模型 |
| DeepSeek-R1-Distill-Qwen-14B | 2025/7/4 | 蒸馏模型 |
| DeepSeek-R1-Distill-Qwen-32B | 2025/7/4 | 蒸馏模型 |
| Qwen2.5-72B-Instruct | 2025/7/4 | 通用大语言模型 |
| Qwen2.5-72B-Instruct-128K | 2025/7/4 | 通用大语言模型 |
| Qwen2.5-VL-7B-Instruct | 2025/7/4 | 视觉语言模型 (VL) |
| Kimi-K2-Instruct | 2025/7/16 | 通用大语言模型 |
| Qwen3-235B-A22B-2507 | 2025/7/22 | 通用大语言模型 |
| Qwen3-Coder-480B-A35B-Instruct | 2025/7/23 | 代码模型 (Coder) |
| GLM-4.5 | 2025/8/28 | 通用大语言模型。 |
2. 接口优势
✅ OpenAI兼容:无缝迁移现有应用
✅ 超低延迟:平均响应<300ms,QPS支持1000+
✅ 多语言生成:中文、英文、德语等100+语言
✅ 精细控制:通过temperature、top_p等参数调节生成质量
✅ 代码专精:支持多种编程语言生成与修复
3. 认证与安全
接口地址
https://api.edgefn.net/v1
认证方式
bash
Authorization: Bearer YOUR_API_KEY- 获取API Key:登录控制台 > 个人中心 > API密钥
- 安全性:HTTPS加密传输,支持IP白名单配置
4. LLM模型API
请求地址
http
POST /v1/chat/completions请求参数
| 参数名 | 类型 | 必填 | 说明 |
|---|---|---|---|
model | string | 是 | 模型ID(如DeepSeek-R1-0528) |
prompt | string | 是 | 输入提示词 |
temperature | number | 否 | 随机性控制(0-2,默认1) |
max_tokens | integer | 否 | 最大输出长度(默认256) |
top_p | number | 否 | 核采样概率(默认1.0) |
n | integer | 否 | 返回结果数量(默认1) |
返回字段说明
json
{
"id": "DeepSeek-R1-0528",
"choices": [
{
"text": "答案内容...",
"index": 0,
"logprobs": null,
"finish_reason": "length" // 可能值:length/eos_token/stop
}
],
"usage": {
"prompt_tokens": 15,
"completion_tokens": 30,
"total_tokens": 45
}
}5. 流式响应支持
通过设置stream=true实现逐字输出:
http
POST /v1/completions
{
"model": "DeepSeek-R1-0528",
"prompt": "写一首关于春天的诗",
"stream": true
}流式返回格式(SSE协议)
data: {"choices":[{"delta":{"content":"春风"},"index":0}]}
data: {"choices":[{"delta":{"content":"轻拂杨柳枝"},"index":0}]}
...
data: [DONE]6. 错误代码详解
| 状态码 | 错误类型 | 示例响应体 |
|---|---|---|
400 | 参数校验失败 | {"error": {"message": "Missing required parameter: prompt", "type": "invalid_request"}} |
401 | 鉴权失败 | {"error": {"message": "Invalid API key", "type": "authentication_error"}} |
429 | 配额超限 | {"error": {"message": "Rate limit exceeded", "type": "rate_limit_error"}} |
500 | 服务内部错误 | {"error": {"message": "Internal server error", "type": "server_error"}} |
联系方式:技术问题请发送邮件至 support@baishan.com
文档最后更新时间:2025-08-11
