海西股票配资如何预期DeepSeek传言中的R2新模型

发布日期：2025-02-28 23:03 点击次数：126

　　炒股就看金麒麟分析师研报海西股票配资，权威，专业，及时，全面，助您挖掘潜力主题机会！

　　信息平权

　　路透2月25日报道了DeepSeek可能在5月前发布r2。之前DeepSeek研究员Daya在2月初已经说过：RL还在早期，今年会看“显著进步”（significant progress）

　　其实在r1论文中也提到过：由于目前RL训练数据还很少，R1的下个版本会大幅提升。

　　也就是r1论文中的下图，以及论文所述：随着RL数据的增加，模型不仅解决复杂推理任务的能力持续稳定提升，且会自然涌现出一些复杂行为能力，比如“反思”、“探索不同方法”。这些能力不是人类设计，而是随着模型在RL环境中训练，自然涌现的。

　　粗浅的理解，现在不需要算法上的巨大创新，按照目前路线+更多算力+DS如此强的infra能力，基于目前的V3基座模型，依然可以取得r2/r3。当看到RL提升边际放缓，再基于新的基座V4，继续做RL，进一步推进推理模型提升。也就是下面这张图：（左脚踩右脚示意图）

　　而参考OpenAI的路线图，o3已经决定不发布完整模型，GPT-4.5也成了最后一个独立发布的基座模型，意味着GPT-5（混合模型）开始，越来越黑盒。说白了，以后无论是基座模型还是推理模型本身，都是“原料”而不是“最终产品”，CloseAI和Anthropic一定会雪藏。

　　但DeepSeek要做的，就是在别人继续闭源的时候，继续开源。r2应该对标的是o3完整版，而V4至少应该对标GPT-4.5，基于V4+RL的模型，应该对标是未来的所谓“GPT-5”。因此合理预期应该是V4可能会加入多模态能力，但r系列依然是推理模型。且这个过程中，所有的“原料”全部开源，不仅原料开源，按照这次代码五连发，连制造原材料的“配方”都直接开源。

　　这里面其实没有什么DeepSeek不知道的秘密，甚至在infra层面远超北美很多模型大厂。今天我们在讨论的：DeepSeek甚至可能比英伟达更懂如何使用GPU。而所谓Research上的创新，OpenAI o系列的灵感也来自于早已发表的“开源”paper，叠加自己的算力优势和工程探索实现。说到底没人全靠自己闭门造车，都受益于全世界“开源”研究或实践的喂养。

　　因此说回来，相比于r2，大家反而应该更期待V4，因为这打开了推理模型另一个level天花板，开辟的是另一条全新跑道。r2是时间表上确定的事情，而V4会是一个惊喜。这都会在今年发生。

　　（完）

　　文章内容有删减

新浪声明：此消息系转载自新浪合作媒体，新浪网登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。文章内容仅供参考，不构成投资建议。投资者据此操作，风险自担。

海量资讯、精准解读，尽在新浪财经APP

责任编辑：凌辰海西股票配资

上一篇：中国a股可以加杠杆比特元宇宙(08645)发布中期业绩股东应占亏损744.2万港元同比收窄32.49%

下一篇：炒股杠杆软件市场将迎第5家合资理财公司！法巴银行与农行设合资理财公司获批理财市场竞争加速

股票配资公司|上海股票配资|上海股票配资公司

股票配资公司

海西股票配资如何预期DeepSeek传言中的R2新模型

股票配资公司|上海股票配资|上海股票配资公司

股票配资公司

海西股票配资 如何预期DeepSeek传言中的R2新模型

海西股票配资如何预期DeepSeek传言中的R2新模型