2025年1月,杭州深度求索科技有限公司正式发布了其全新的推理模型 DeepSeek R1,这一系列模型被视为能够与 OpenAI 的 o1 模型直接竞争的产品。DeepSeek R1 包括两个主要版本:DeepSeek-R1-Zero和 ...
中央民族大学教授郭全中对此表示:“中国AI公司之前基本都在摸着OpenAI的石头过河,但从Kimi ...
人红是非多,公司也一样,目前风头正劲的OpenAI又双叒叕一次踏入了漩涡。作为OpenAI去年年末一连串新品发布中的一部分,其推理模型o3在展示了前所未有的能力之后,近期有消息人士透露,o3令人震惊的成绩是建立在作弊的基础上。数天前,知名技术社区Le ...
多知1月17日消息,通义千问Qwen宣布开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,包括72B和7B两个版本,将提升大型语言模型(LLMs)在数学推理过程中的可靠性和可信度,自动识别推理过程中的错误,如计算或逻辑错误,这些错误可能导致不正确的结论,即使最终答案正确,也可能削弱模型推理过程的可信度。在识别推理错误步 ...
因为根据DeepSeek的研究,模型的进步并非均匀渐进的。在强化学习过程中,响应长度会出现突然的显著增长,这些“跳跃点”往往伴随着解题策略的质变。这种模式酷似人类在长期思考后的突然顿悟,暗示着某种深层的认知突破。
中国“双子星”打开了OpenAI的黑箱。此前,OpenAI定义了大模型训练的四个阶段:预训练、监督微调、奖励建模、强化学习。现在,这个范式被打破了,Kimi 和DeepSeek都证明了可以跳过和简化某些环节来提升模型的训练效率和性能。
作者|周一笑邮箱|[email protected]年关将至,大模型行业又热闹了起来。一天之内,两个“对标”o1的国产大模型相继发布,分别是DeepSeek的DeepSeek R1,以及Kimi的k1.5。先是DeepSeek发布了性能比肩OpenAI ...
从技术报告看,K1.5的亮点是真的不少。
本报讯 (记者袁传玺)1月20日,国内两家备受关注的人工智能大模型创业公司北京月之暗面科技有限公司(以下简称“月之暗面”)(Kimi)和杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)(DeepSeek)均发布了最新模型。
因为根据DeepSeek的研究,模型的进步并非均匀渐进的。在强化学习过程中,响应长度会出现突然的显著增长,这些"跳跃点"往往伴随着解题策略的质变。这种模式酷似人类在长期思考后的突然顿悟,暗示着某种深层的认知突破。
OpenAI的联合创始人Greg Brockman就是一个绝佳的例子,妥妥的AMC受益者。他在 中学期间至关重要的活动就是深度参与AMC美国数学竞赛 , 并在高中时期成功打入全美数学奥林匹克决赛USAMO, 被哈佛和MIT加分录取 。
此前的数次融资活动,OpenAI都募集到了大量的让普通创业者艳羡的巨额资金,但对于OpenAI的AI大计而言,那些钱都只是杯水车薪。OpenAI CEO山姆·奥特曼曾提出用7万亿美元重塑半导体产业,为AI时代奠定基础的想法。