
3月16日,小米AI实验室研究员罗福莉团队与北京大学联合发表新论文,提出一套名为ARL-Tangram的统一资源管理系统,可将AI智能体强化学习训练效率提升1.5倍,外部资源成本降低71.2%。
论文以《ARL-Tangram:释放智能体强化学习中的资源效率》为题发表在Arxiv上,罗福莉担任通讯作者。这是她去年11月官宣加入小米后发表的第二篇成果。系统已部署用于支持小米MiMo系列模型训练。
罗福莉团队在论文中指出,传统Agent任务中CPU线%,大量算力处于闲置状态。ARL-Tangram采用“动作级调度”取代传统“任务级调度”,只有当具体操作需要资源时才分配,实现细粒度资源共享。
去年11月12日,罗福莉在朋友圈官宣加入小米:“智能终将从语言迈向物理世界。我正在Xiaomi MiMo,和一群富有创造力、才华横溢且真诚热爱的研究员,致力于构建这样的未来。”此前雷军被曝以千万年薪招揽其加入小米。
公开资料显示,罗福莉本科毕业于北京师范大学,硕士就读于北京大学计算语言学研究所。2019年在人工智能顶级会议ACL上发表8篇论文,毕业后加入阿里达摩院,2022年进入DeepSeek母公司幻方量化,参与研发DeepSeek-V2模型。
今年2月,罗福莉曾发朋友圈回应外界关注:“请互联网还我一片安安静静做事的氛围吧,我不是天才少女,只想安安静静做难而正确的事情。”返回搜狐,查看更多