当前位置:主页 > 热点 > 正文

昨夜3件事,加强中国AI科技叙事?

发布时间:2025-03-06 已有: 位 网友关注

  阿里通义没有食言,说这周再开源一个RL新模型,昨晚放出来了。最厉害的是32B性能比肩满血DeepSeek R1,在测试数学能力的AIME24评测集上,以及评估代码能力的LiveCodeBench中,千问QwQ-32B表现与DeepSeek-R1相当,远胜于o1-mini及相同尺寸的R1蒸馏模型,现在已经可以在通义和网页端体验了。

  而且看起来,这个RL训练并没有花费太长时间,阿里的朋友反馈,与以往奖传统励模型不同的是,说这次是通过校验生成答案的正确性来为数学问题提供反馈。

  高性能大模型本地化部署门槛进一步降低,现在一个4090就可以了,极限一点大于24G内存的Mac mini就可以部署,国补下,4位数内搞定。

  影响就是RL的潜力又被放大了,智能硬件的能力的提升可能很快会到来?应用的需求又会爆发,又利好了Agent的发展。

  苹果发布Mac studio 7w多的价格可以本地满血DS-R1,预计20token/s;

  Manus AI这个Monica团队打造的Agent刷屏,但市场对Agent能力有了更多认识和期待,应用端期待更高了。;

  这三条,又要改变一些市场对AI的叙事,但可以预见,RL的大规模强化学习的scaling law已经出现,以阿里为代表的中国科技公司将会迎来持续的重估。

温馨提示:所有理财类资讯内容仅供参考,不作为投资依据。