工厂自动化软件环境集成
内置本地模型库
内置人机交互界面
开放二次开发接口
内置经过参数优化的推理引擎
满足更多并发下的使用体验
优异的TPS/TTFT/TPOT性能
基于成熟G5208硬件平台
采用高品质原装计算卡
多家CSP一致选择
| G5208 R1-32B-Pro | G5208 R1-32B-Premier | G5208 R1-70B-Lite | G5208 R1-70B-Premier | |
| 硬件参数 | ||||
| CPU资源 | 64核 | 64核 | 64核 | 64核 |
| 系统缓存 | 512G | 512G | 512G | 512G |
| 算力能力 | 96G显存、2048张量核、1.29PFLOPS算力 | 192G显存、4096张量核、2.58PFLOPS算力 | 96G显存、2048张量核、1.29PFLOPS算力 | 192G显存、4096张量核、2.58PFLOPS算力 |
| 软件环境 | ||||
| 模型 | DeepSeek-R1-Distill-Qwen-32B | DeepSeek-R1-Distill-Qwen-32B | DeepSeek-R1-Distill-Llama-70B FP8-Dynamic | DeepSeek-R1-Distill-Llama-70B |
| 知识库 | Dify | Dify | Dify | Dify |
| 其他 | 集成PyTorch深度学习框架、SGLang推理引擎、WEB人机交互 | 集成PyTorch深度学习框架、SGLang推理引擎、WEB人机交互 | 集成PyTorch深度学习框架、SGLang推理引擎、WEB人机交互 | 集成PyTorch深度学习框架、SGLang推理引擎、WEB人机交互 |
| 性能参数 | ||||
| 并发数 | 80 | 160 | 32 | 32 |
| TPS | 1623 tokens/s | 2842 tokens/s | 694 tokens/s | 616 tokens/s |
| TTFT | 0.372s | 0.380s | 0.372s | 0.348s |
| TPOT | 0.047s | 0.052s | 0.045s | 0.051s |
| G5208 R1-671B-Lite | G5208 R1-671B-Premier | |
| 硬件参数 | ||
| CPU资源 | 256核 | 384核 |
| 系统缓存 | 2048G | 3072G |
| 网络环境 | 25G以太网 | |
| 算力能力 | 768G显存、16384张量核、10.32PFLOPS算力 | 1152G显存、24576张量核、15.48PFLOPS算力 |
| 软件环境 | ||
| 模型 | DeepSeek-R1-AWQ | DeepSeek-R1 |
| 知识库 | Dify | |
| 其他 | 集成PyTorch深度学习框架、vLLM推理引擎、WEB人机交互 | 集成PyTorch深度学习框架、vLLM推理引擎、WEB人机交互 |
| 性能参数 | ||
| 并发数 | 16 | 24 |
| TPS | 10 tokens/s | 10 tokens/s |
| 计算精度 | INT4 | |
了解有关该产品的更多信息 , 请联系销售代表代表或业务合作伙伴