今年 1 月,DeepSeek R1 引爆了全球科技界,它创新的方法,大幅简化的算力需求撼动了英伟达万亿市值,更引发了全行业的反思。在通往 AGI(通用人工智能)的路上,我们现在不必一味扩大算力规模,更高效的新方法带来了更多的创新可能。
近年来,人工智能领域的快速发展已经变得不可逆转,特别是在生成式人工智能的应用上。最近,微软的消息着实让Windows用户为之振奋——公司宣布,所有Copilot用户将能够免费使用OpenAI的o1模型,这一模型原本每月收费超过200美元。此举无疑为广 ...
中国 AI 公司 DeepSeek 近期发布了新一代模型 DeepSeek-R1,在复杂领域的推理能力上媲美 OpenAI 的 o1,甚至在多个数学和编程基准测试上超越了它。
IT之家 2 月 2 日消息,OpenAI 本周宣布对旗下 ChatGPT Canvas 写作工具进行更新,主要上线 o1 模型、新增支持渲染 HTML 和 React 代码,同时 Canvas 功能也正式登陆 ChatGPT ...
新智元报道 编辑:KingHZ 乔杨【新智元导读】Ai2研究科学家Nathan Lambert总结语言推理现状,揭开OpenAI o1训练中强化学习的秘密。关注NLP领域的人们,一定好奇「语言模型能做什么?」「什么是o1?」「为什么思维链有效?」在NeurIPS的Latent Space非官方Industry Track上,Ai2研究科学家Nathan ...
春节期间,国内外AI圈都被DeepSeek刷屏。英伟达的股市震荡更是让全世界瞩目。DeepSeek最近发布的两个模型——DeepSeek-V3和DeepSeek-R1以较低成本获得了与OpenAI同类模型相当的性能,这引发了市场对AI硬件需求的担忧, ...
比拼结果: DeepSeek R1 的回复以一种荒诞的方式回应了这个荒诞的提示。该团队非常喜欢其中的一些细节,比如它创造了一项「让人们不是跳进战壕,而是跳向荣耀」的运动,以及规则的「第 13 ...
1月20日发布的 DeepSeek-R1 模型让开发公司DeepSeek在全球的热度持续攀升。1月27日,DeepSeek接连登顶苹果中国和美国地区应用商城的免费应用排行榜,甚至超越了大众熟知的ChatGPT。
斯坦福大学最近的一项研究发现,尽管 o1-preview 在数学、代码等领域能力逆天,但只要对数学竞赛的题目稍修改,模型解答的准确率竟会立刻下降 30%。 在数学竞赛的领域里,普特南数学竞赛的威名可谓如雷贯耳。它由 William Lowell Putnam 家族发起,自 1938 年首届举办以来,历经 66 年的岁月沉淀,已然成为全球大学生数学精英们一较高下的顶级赛场。
IT之家 1 月 31 日消息,Microsoft AI 公司首席执行官穆斯塔法・苏莱曼(Mustafa Suleyman)昨日(1 月 30 日)在 X 平台发布推文,宣布所有 Microsoft Copilot 用户现在都可以免费使用 OpenAI 的 o1 推理模型。
这项研究的惊人之处在于,o1-preview模型面对原始的普特南数学竞赛题时,能够取得高达41.95%的准确率。这一结果把大多数人都震惊了,然而,当题目中变量和常量被稍作调换时,模型的准确率却立刻跌至11.95%,令人叹为观止。
o1-preview总分最高 通过比较15篇由10位博士审阅的论文,研究者分析了3个LLM(gpt-4o、o1-mini、o1-preview)在实验质量、报告质量和实用性方面的表现。