选择你喜欢的标签
我们会为你匹配适合你的网址导航

跳过将删除所有初始化信息

DeepSeek研究员在线爆料：过年都没歇还有大招！

技术 2025-02-05 12:01

声明：该文章来自（新浪证券）版权由原作者所有，K2OS渲染引擎提供网页加速服务。

大年初四Daya Guo发了一条推文，透露了春节期间让他最兴奋的事情，亲眼见证了R1-Zero模型性能曲线的 “持续增长”，并且直言感受到了强化学习（RL）的强大力量。

Daya Guo回复了网友有关DeepSeek R1的一些问题，以及接下来的公司的计划，只能说DeepSeek的R1仅仅只是开始，内部研究还在快速推进，DeepSeek的研究员过年都没歇，一直在爆肝推进研究，接下来DeepSeek还有大招。

网友提问：“如果不是秘密的话：这次RL训练跑了多久？”对此，Daya Guo表示，660B参数的R1-Zero和R1是在V3发布之后才开始跑的，训练大约花了2-3周。

此外，他还表示在尝试将R1应用于形式化证明环境，希望尽快向社区发布更好的模型。听Daya Guo的意思，他们在这方面已经有进展，未来可能会有更重磅的模型发布！期待值拉满！

关注我们

[超站]友情链接：

四季很好，只要有你，文娱排行榜：https://www.yaopaiming.com/
关注数据与安全，洞悉企业级服务市场：https://www.ijiandao.com/

*文章为作者独立观点，不代表 0XUCN 立场

本文由 sunwall 发表，转载此文章须经作者同意，并请附上出处(0XUCN)及本页链接。

原文链接 https://www.0xu.cn/article/intelnet/technology/55141.html

DeepSeek 新浪证券

图库

百度热搜榜

排名热点搜索指数

bgame.cn

分享文章

微信
微信扫码分享

新浪微博
离开
复制链接
返回顶部