搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
15 天
阿里云通义Qwen2.5-Math-PRM:7B模型超越GPT-4o,数学推理新突破
1月16日消息,阿里云通义团队发布了新一代数学推理过程奖励模型——Qwen2.5-Math-PRM。该模型引入了72B与7B两种尺寸,其在推理过程中的表现显著优于现有的开源模型,尤其在推理错误识别方面,7B版本的性能甚至超过了闭源的GPT-4o。这一创新不仅为智能推理提供了新的可能性,也为相关领域的技术进步注入了新的活力。 Qwen2.5-Math-PRM模型的设计旨在解决大型语言模型在处理推理时 ...
15 天
阿里云Qwen2.5-Math-PRM模型:小尺寸也能超越GPT-4o的推理荒谬探测能力
在数字化的时代,推理能力的较量正如同科技界的竞技场。最近,阿里云推出了其最新的数学推理过程奖励模型:Qwen2.5-Math-PRM。这款模型以仅有7B的微小参数量,颠覆了大型人工智能模型的传统认知,再次证明了更小也能更聪明的真理!
腾讯网
14 天
阿里云通义开源全新数学推理过程奖励模型Qwen2.5-Math-PRM
多知1月17日消息,通义千问Qwen宣布开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,包括72B和7B两个版本,将提升大型语言模型(LLMs)在数学推理过程中的可靠性和可信度,自动识别推理过程中的错误,如计算或逻辑错误,这些错误可能导致不正确的结论,即使最终答案正确,也可能削弱模型推理过程的可信度。在识别推理错误步 ...
来自MSN
5 个月
通义千问开源数学模型Qwen2-Math,数学能力超越GPT-4o|新榜情报
新榜讯 今日阿里通义团队发布了一款新一代数学模型——Qwen2-Math,并为开发者们提供了包含1.5B、7B、72B三个参数的基础模型和指令微调模型。
15 天
阿里云通义推出Qwen2.5-Math-PRM模型与首个推理评估标准
在科技快速发展的今天,阿里云再一次为人工智能领域推陈出新。1月16日,钛媒体App报道了阿里云通义开源了全新的数学推理过程奖励模型——Qwen2.5-Math-PRM。这一模型的推出,标志着在72B与7B尺寸下,其性能远超同类开源过程奖励模型。
IT之家
19 天
微软 rStar-Math 技术登场:小语言 AI 模型数学推理从“不及格”一跃 ...
IT之家1 月 11 日消息,微软亚洲研究院旗下数学和人工智能研究团队昨日(1 月 10 日)发布博文,针对小语言模型,设计并开发了 rStar-Math 技术,专门用于解决数学问题。 和微软之前推出的 Phi-4 不同,rStar-Math 采用蒙特卡洛树搜索(Monte Carlo Tree Search)进行推理 ...
来自MSN
1 个月
《极乐迪斯科》制作人新工作室Dark Math Games再获七位数投资
Dark Math Games 工作室为其首个项目“XXX Nightshift”获得了额外的投资。工作室并未透露具体金额,但告诉 GI.biz 新融资为 7 位数。 此次投资来自爱沙尼亚投资公司 MM Grupp,此前它还是 ZA/UM 开发的好评 RPG《极乐迪斯科》的主要投资者,而 Dark Math 就是今年早些时候由 ...
来自MSN
2 个月
月之暗面:Kimi发布k0-math模型,数学能力对标OpenAI o1系列
11月16日,月之暗面公司旗下的Kimi品牌正式发布了其最新研发的数学推理模型k0-math。该模型在基准测试中的表现显示,其数学能力能够与OpenAI的o1系列中两个可公开使用的模型——o1-mini和o1-preview相媲美。月之暗面创始人杨植麟表示,数学场景是AI锻炼思考能力的 ...
界面新闻
2 个月
Kimi发布新一代推理模型,数学能力对标OpenAI o1系列
11月16日,Kimi正式发布新一代数学推理模型k0-math。基准测试显示,Kimi k0-math的数学能力可对标OpenAI o1系列可公开使用的两个模型:o1-mini和o1-preview。在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中,k0-math初代模型成绩超过o1-mini和o1-preview模型。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈