VSport(中国)官网-体育成就梦想

新闻资讯

AI训练分析CASE

大众运动健身数据服务

大众运动健身数据服务

青训俱乐部数据化管理

青训俱乐部数据化管理

校园足球AI训练分析项目

校园足球AI训练分析项目

公司动态

依托国产算力完成万亿级模型训练深圳河套学院联合多家单位实现DeepSeek-V4-Pro从“能跑”到“能训、训稳、训优”

日期:2026-06-04 22:05:34

  

依托国产算力完成万亿级模型训练深圳河套学院联合多家单位实现DeepSeek-V4-Pro从“能跑”到“能训、训稳、训优”(图1)

  (深圳特区报记者 焦子宇 许依妍)当今人工智能时代,基于国产算力的大模型高效训练和推理是国家发展战略的大问题。近日,深圳河套学院联合多家单位开展技术攻关,依托昇腾910C国产AI算力集群,完成1.6万亿参数大模型DeepSeek-V4-Pro全流程训练。此次实践为全球第三方机构在国产算力平台上完成该级别模型训练的相关探索积累了重要经验,也印证了国产AI芯片可支撑世界级超大参数模型训练工作。

  DeepSeek-V4-Pro在效率和性能方面是业界大模型的杰出代表。DeepSeek-V4-Pro已经成功完成在国产算力上推理部署,但训练还未完全实现国产算力化。在此背景下,深圳河套学院AI训练平台项目团队,联合哈尔滨工业大学(深圳)、深圳大数据研究院、华为GTS(全球技术服务)、计算产品线实验室,协同深智城AI算力平台,面向国产算力大模型训练开展联合攻关。

  项目采用千卡级算力集群开展训练,运行全程稳定、未出现中断情况,各项指标达到工业运行标准,进一步检验了国产算力对不同类型超大参数模型的适配与承载能力。目前,仅用1个月时间,项目已基于昇腾910C国产算力集群实现DeepSeek-V4-Pro全参数续训练/SFT稳定运行,完成长稳训练1500+步,训练MFU超30%,关键训练算子效率提升14%,是业界首个由第三方机构基于国产算力集群完成的DeepSeek-V4-Pro全参数后训练工程实践。

  在同等参数量下,业界公开的国产算力全参数后训练案例几乎为零。而该项目将一个1.6T MoE模型,在千卡集群上以27秒/步的稳定节奏,连续奔跑1500余步。项目通过三大关键技术突破,实现了从“能跑”到“能训、训稳、训优”。

  深圳河套学院将万亿级模型训练攻关作为“练兵场”,把学生直接嵌入国产算力真实训练场景。截至目前,项目已培养学生42名,形成了由青年教师指导、博士生核心攻坚、工程团队支撑的协同培养机制。

  下一阶段,深圳河套学院将继续联合合作伙伴,在现有全参数续训练/SFT链路基础上,持续优化训练框架与关键算子,力争实现训练效率再突破,超长上下文训练,强化学习后训练闭环,并持续完善“国产算力支撑、真实任务牵引、学生团队实战、工程能力沉淀”的培养路径。