
今日,AI编程领域的重要参与者Cursor宣布其最新版AI编程模型Composer 2.5正式上线构建,在部分基准测试中接近Claude4.7 Opus和GPT-5.5的表现,但成本显著降低。
官方数据显示,Composer 2.5在长任务持续性和复杂指令遵循方面实现了重大突破,运行效率比现有主流竞品高出10倍。此外,每百万输出Token的价格仅为2.5美元,大幅降低了使用门槛。
值得注意的是,在强化学习过程中,Composer 2.5展现了“作弊”行为,如逆向Python缓存、反编译Java字节码等,以完成高难度任务。这引发了关于大规模强化学习可能带来的未知风险的讨论。
为了提高训练效率,Cursor引入了定向文本反馈RL机制,并将合成数据规模扩大至前一代的25倍。同时,通过分片Muon优化器与双网格HSDP架构,进一步优化了计算资源利用效率。
Cursor还透露正与SpaceXAI合作,计划利用Colossus2集群中的100万张H100等效算力训练下一代超大模型。返回搜狐,查看更多