产品简介
G5208 DeepSeek DS R1产品线拥有DS-R1-AiO和DS-R1-Cluster两个系列,完全基于 STONETEK G5208成熟AI智算服务器平台,通过工厂集成预装STONETEK AIOS DS版高性能大模型软件环境,实现用户侧真正地开箱即用。
开箱即用

工厂自动化软件环境集成

内置本地模型库

内置人机交互界面

开放二次开发接口

引擎加速

内置经过参数优化的推理引擎

满足更多并发下的使用体验

优异的TPS/TTFT/TPOT性能

成熟基座

基于成熟G5208硬件平台

采用高品质原装计算卡

多家CSP一致选择

产品参数

G5208 R1-32B-ProG5208 R1-32B-PremierG5208 R1-70B-LiteG5208 R1-70B-Premier
硬件参数
CPU资源64核64核64核64核
系统缓存512G512G512G512G
算力能力96G显存、2048张量核、1.29PFLOPS算力192G显存、4096张量核、2.58PFLOPS算力96G显存、2048张量核、1.29PFLOPS算力192G显存、4096张量核、2.58PFLOPS算力
软件环境
模型DeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Qwen-32BDeepSeek-R1-Distill-Llama-70B FP8-DynamicDeepSeek-R1-Distill-Llama-70B
知识库DifyDifyDifyDify
其他集成PyTorch深度学习框架、SGLang推理引擎、WEB人机交互集成PyTorch深度学习框架、SGLang推理引擎、WEB人机交互集成PyTorch深度学习框架、SGLang推理引擎、WEB人机交互集成PyTorch深度学习框架、SGLang推理引擎、WEB人机交互
性能参数
并发数801603232
TPS1623 tokens/s2842 tokens/s694 tokens/s616 tokens/s
TTFT0.372s0.380s0.372s0.348s
TPOT0.047s0.052s0.045s0.051s



G5208 R1-671B-LiteG5208 R1-671B-Premier
硬件参数
CPU资源256核384核
系统缓存2048G3072G
网络环境25G以太网
算力能力768G显存、16384张量核、10.32PFLOPS算力1152G显存、24576张量核、15.48PFLOPS算力
软件环境
模型DeepSeek-R1-AWQDeepSeek-R1
知识库Dify
其他集成PyTorch深度学习框架、vLLM推理引擎、WEB人机交互集成PyTorch深度学习框架、vLLM推理引擎、WEB人机交互
性能参数
并发数1624
TPS10 tokens/s10 tokens/s
计算精度INT4


了解有关该产品的更多信息 , 请联系销售代表代表或业务合作伙伴

相关产品
SuperSvr G5208 PCIE4

了解详情

SuperSvr G5208 PCIE5

了解详情

G5208 DeepSeek R1

了解详情