o1 - 搜索 News

3 小时

今年 1 月，DeepSeek R1 引爆了全球科技界，它创新的方法，大幅简化的算力需求撼动了英伟达万亿市值，更引发了全行业的反思。在通往 AGI（通用人工智能）的路上，我们现在不必一味扩大算力规模，更高效的新方法带来了更多的创新可能。

2 天

近年来，人工智能领域的快速发展已经变得不可逆转，特别是在生成式人工智能的应用上。最近，微软的消息着实让Windows用户为之振奋——公司宣布，所有Copilot用户将能够免费使用OpenAI的o1模型，这一模型原本每月收费超过200美元。此举无疑为广 ...

2 天

DeepSeek-R1全面超越OpenAI o1：开源大模型训练范式革新

中国 AI 公司 DeepSeek 近期发布了新一代模型 DeepSeek-R1，在复杂领域的推理能力上媲美 OpenAI 的 o1，甚至在多个数学和编程基准测试上超越了它。

2 天on MSN

OpenAI 宣布 ChatGPT Canvas 写作工具上线 o1 模型

IT之家 2 月 2 日消息，OpenAI 本周宣布对旗下 ChatGPT Canvas 写作工具进行更新，主要上线 o1 模型、新增支持渲染 HTML 和 React 代码，同时 Canvas 功能也正式登陆 ChatGPT ...

腾讯网4 天

o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

新智元报道编辑：KingHZ 乔杨【新智元导读】Ai2研究科学家Nathan Lambert总结语言推理现状，揭开OpenAI o1训练中强化学习的秘密。关注NLP领域的人们，一定好奇「语言模型能做什么？」「什么是o1？」「为什么思维链有效？」在NeurIPS的Latent Space非官方Industry Track上，Ai2研究科学家Nathan ...

中华网4 天

DeepSeek独立发现o1的一些核心思路低成本高性能引热议

春节期间，国内外AI圈都被DeepSeek刷屏。英伟达的股市震荡更是让全世界瞩目。DeepSeek最近发布的两个模型——DeepSeek-V3和DeepSeek-R1以较低成本获得了与OpenAI同类模型相当的性能，这引发了市场对AI硬件需求的担忧， ...

6 天

DeepSeek R1有没有赶上OpenAI o1？八大场景测评结果出炉

比拼结果： DeepSeek R1 的回复以一种荒诞的方式回应了这个荒诞的提示。该团队非常喜欢其中的一些细节，比如它创造了一项「让人们不是跳进战壕，而是跳向荣耀」的运动，以及规则的「第 13 ...

8 天

记者实测 | DeepSeek-R1对决四款主流推理模型：基础题意外“翻车 ...

1月20日发布的 DeepSeek-R1 模型让开发公司DeepSeek在全球的热度持续攀升。1月27日，DeepSeek接连登顶苹果中国和美国地区应用商城的免费应用排行榜，甚至超越了大众熟知的ChatGPT。

5 天

斯坦福揭秘 o1-preview 软肋：数学竞赛题稍作修改，准确率骤降 30%

斯坦福大学最近的一项研究发现，尽管 o1-preview 在数学、代码等领域能力逆天，但只要对数学竞赛的题目稍修改，模型解答的准确率竟会立刻下降 30%。在数学竞赛的领域里，普特南数学竞赛的威名可谓如雷贯耳。它由 William Lowell Putnam 家族发起，自 1938 年首届举办以来，历经 66 年的岁月沉淀，已然成为全球大学生数学精英们一较高下的顶级赛场。

5 天on MSN

OpenAI o1 推理模型免费用，微软 Copilot 开放“深度思考”AI 功能

IT之家 1 月 31 日消息，Microsoft AI 公司首席执行官穆斯塔法・苏莱曼（Mustafa Suleyman）昨日（1 月 30 日）在 X 平台发布推文，宣布所有 Microsoft Copilot 用户现在都可以免费使用 OpenAI 的 o1 推理模型。

5 天

斯坦福大学揭示o1-preview模型数学能力软肋：改变题目，准确率骤降30%！

这项研究的惊人之处在于，o1-preview模型面对原始的普特南数学竞赛题时，能够取得高达41.95%的准确率。这一结果把大多数人都震惊了，然而，当题目中变量和常量被稍作调换时，模型的准确率却立刻跌至11.95%，令人叹为观止。

36氪22 天

AI博士智能体自主科研，o1-preview封神成本暴降84%，AMD霍普金斯新作爆火

o1-preview总分最高通过比较15篇由10位博士审阅的论文，研究者分析了3个LLM（gpt-4o、o1-mini、o1-preview）在实验质量、报告质量和实用性方面的表现。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果