
近日,京东云JoyBuilder模型开发平台迎来重磅升级,成为业界首家支持具身智能千卡级LeRobot开源训练框架的AI开发平台。这一升级不仅标志着技术的重大突破,还有效提升了训练效率,达到开源社区版本的3.5倍,极大地加速了具身智能的规模化应用。
具身智能作为人工智能领域的重要研究方向,面临着复杂的数据处理和计算挑战。训练高效的具身模型需要同时处理图像、文本和连续动作信号等多种数据,这在工程实施中往往导致数据读取缓慢、算力效率低下等一系列性能瓶颈。京东云针对这些痛点,基于JoyBuilder平台进行了全方位的技术优化。
首先,在具身数据链路优化方面,JoyBuilder通过重构数据预处理与加载流程,实现了CPU数据处理与GPU计算的异步执行,显著减少了等待时间。此外,自研的高性能并行文件系统云海JPFS通过分布式元数据管理与智能预取,支持高并发访问,使得在1024卡集群上读取带宽超过400GB/s,确保数据的持续高速供给。
其次,针对主流开源的视觉-语言-动作(VLA)模型,京东云在模型计算优化上进行了深度挖掘。通过对Attention层、Token裁剪和训练后量化等方面的极致优化,JoyBuilder显著提升了模型的训练效率。
在基础设施方面,京东云搭建了3.2TRDMA后端网络,采用多轨道优化和智能震荡抑制技术,确保千卡间的高吞吐和低延迟。同时,基于云原生的AI数据湖优化了数据调度和流水线,进一步提升了端到端处理效率。
京东云JoyBuilder平台的另一大亮点是其支持业界最新的LeRobot训练数据协议。早期的LeRobot V2.1协议由于“单episode单文件”的设计,导致在大规模样本训练时产生数据加载瓶颈。京东云通过一键升级至“多episode合并分片”的V3协议,不仅解决了数据链路低效的问题,还将训练数据供给速度提升了超10倍,极大提升了云侧算力的利用率。
作为行业首家支持具身模型千卡级开源训练框架的AI开发平台,京东云JoyBuilder基于开源LeRobot框架,首次实现了GR00T模型的千卡分布式高效训练。经过技术优化,训练时间从15小时缩短至22分钟,提升速度达到40倍,显著降低了千卡训练的使用门槛与运行成本。
最后,京东云的技术创新不仅限于训练效率的提升,更为具身智能的广泛应用打下了基础。通过构建一站式大模型产品矩阵,京东云为企业提供了从智算基础设施到模型服务及工具的全面支持,推动机器人更好地理解和服务物理世界,开启人机协作的新篇章。
总之,京东云JoyBuilder的全新升级在具身智能训练效率和技术协同上取得了显著成就,为行业的进一步发展提供了强有力的支持。返回搜狐,查看更多