今年 1 月,DeepSeek R1 引爆了全球科技界,它创新的方法,大幅简化的算力需求撼动了英伟达万亿市值,更引发了全行业的反思。在通往 AGI(通用人工智能)的路上,我们现在不必一味扩大算力规模,更高效的新方法带来了更多的创新可能。
在刘知远看来,OpenAI o1相当于引爆了一颗原子弹,但没有告诉大家秘方。DeepSeek则可能是全球首个能够通过纯粹的强化学习技术复现OpenAI o1能力的团队,他们通过开源并发布相对详细的介绍,为行业发展做出了重要贡献。
Microsoft日前宣布免费开放OpenAI的GPT-o1推理模型“Think Deeper”给所有Copilot用户。GPT-o1模型可利用深层思考,通过逐步生成推理过程来提升答案精确度,减少错误与低品质内容。 GPT-o1的“Think ...
Windows用户福利来了? 这是那款原本每个月要花费超过200美元的人工智能工具,但现在对部分Windows用户完全免费。微软已经将其“深度思考”AI功能免费提供给所有Copilot用户,包括免费账户。
周三,有道 (DAO.US)涨逾3%,报8.76美元。消息面上,此前,有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。据悉,子曰-o1为14B轻量级单模型,支持在消费级显卡上进行部署,采用思维链技术,提供中文逻辑推理,已在网易有道旗下AI全科学习助手“有道小P”中落地应用。子曰-o1已正式对外开源,将助力教育领域推理模型的广泛应用及创新。
周三,有道 (DAO.US)涨逾3%,报8.76美元。消息面上,此前,有道正式推出国内首个输出分步式讲解的推理模型“子曰-o1”。据悉,子曰-o1为14B轻量级单模型,支持在消费级显卡上进行部署,采用思维链技术,提供中文逻辑推理,已在网易有道旗下AI全科学习助手“有道小P”中落地应用。子曰-o1已正式对外开源,将助力教育领域推理模型的广泛应用及创新。
刘知远指出,人工智能大模型领域存在一个大模型密度定律,即模型能力密度随时间呈指数级增强。2023年以来,大模型的能力密度大约每100天翻一倍,即每过100天,我们只需要一半的算力和一半的参数就能实现相同的能力。
梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI DeepSeek和o1/o3一类推理大模型持续带来震撼之际,有人开始研究他们的弱点了。 最新研究揭示: 在遇到高难度问题时,推理大模型可能像“三心二意的学生”一样频繁切换解题思路,却因缺乏深入探索而失败——这种现象被研究者称为Underthinking(欠思考)。 研究团队来自腾讯AI实验室、苏州大学和上海交通大学,主要研究对象是开源的De ...
DeepSeek-R1的训练成本仅为550万美元左右,远低于OpenAI的GPT-4和o1模型的训练成本。此外,DeepSeek-R1的API服务定价也远低于OpenAI,这将大幅降低AI技术的应用门槛,加速AI下游应用和商业化场景的落地。2025年2月5日,A股市场小幅调整,AI题材科技股逆势爆发。科创板人工智能指数中,优刻得-W、安恒信息涨超20%,金山办公 ...
Hugging Face 的团队,包括公司联合创始人兼首席科学家 Thomas Wolf,表示他们的开放深度研究项目结合了 OpenAI 的 o1模型和一个开源的 “代理框架”。这个框架旨在帮助模型更好地进行信息分析,并指导其使用搜索引擎等工具。尽管 o1是一个付费的专有模型,研究人员认为它在性能上优于一些开放模型,如 DeepSeek 的 R1。
DeepSeek“火爆”全网,一众概念股相继上涨,其中包括了身处AI产业链基础层的金山云。近九个交易日,金山云涨超67%,这也使得雷军享受到了股权增值盛宴。目前,他手持公司市值已超38亿港元。继Kimi、豆包后,当下的DeepSeek成为了AI的新代 ...
春节前夕,DeepSeek发布其开源模型DeepSeek-R1,用较低的成本达到了接近于OpenAI开发的GPT-o1模型的性能。短短几天内,DeepSeek便登顶中美两区苹果应用市场免费榜榜单。这体现了国内人工智能领域的显著进步。