回复青蛙科技:脱离监管,会有很严重的后果
下载贤集网APP入驻自媒体
全球首个分布式RL训练模型INTELLECT-2发布,它仅通过整合全球闲置或分散的计算资源,就完成了模型的强化学习训练,训练成本大大降低。其模型性能与DeepSeek-R1媲美! 一旦范式成立,这也就意味RL训练摆脱了对集中式算力的依赖,世界上任何一个人都可以参与到模型训练当中,大公司垄断算力时代可能就此终结。 据团队成员介绍,他们从编写模型强化学习框架prime-rl,到今天发布大概只用了两个月时间。