昨夜3件事，加强中国AI科技叙事？

发布时间：2025-03-06 已有：位网友关注

　　阿里通义没有食言，说这周再开源一个RL新模型，昨晚放出来了。最厉害的是32B性能比肩满血DeepSeek R1，在测试数学能力的AIME24评测集上，以及评估代码能力的LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1蒸馏模型，现在已经可以在通义和网页端体验了。

　　而且看起来，这个RL训练并没有花费太长时间，阿里的朋友反馈，与以往奖传统励模型不同的是，说这次是通过校验生成答案的正确性来为数学问题提供反馈。

　　高性能大模型本地化部署门槛进一步降低，现在一个4090就可以了，极限一点大于24G内存的Mac mini就可以部署，国补下，4位数内搞定。

　　影响就是RL的潜力又被放大了，智能硬件的能力的提升可能很快会到来？应用的需求又会爆发，又利好了Agent的发展。

　　苹果发布Mac studio 7w多的价格可以本地满血DS-R1，预计20token/s；

　　Manus AI这个Monica团队打造的Agent刷屏，但市场对Agent能力有了更多认识和期待，应用端期待更高了。；

　　这三条，又要改变一些市场对AI的叙事，但可以预见，RL的大规模强化学习的scaling law已经出现，以阿里为代表的中国科技公司将会迎来持续的重估。

上一篇：阿联酋国民银行推出基于APP的加密货交易服务

下一篇：隐私区块链Seismic完成800万美元融资，a16zCrypto领投

温馨提示：所有理财类资讯内容仅供参考，不作为投资依据。

昨夜3件事，加强中国AI科技叙事？

推荐

热门