• 手机快捷登录/注册
  • 账号登录

登录失败,用户名或者密码错误

登录

首页  > 快讯

OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性

2025-02-23 09:45:54
【OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性】近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

最新搜索

中国 汽车 st 半导体 新能源 %27 特朗普 资产重组 新能源汽车 OpenAI 投票 华为 稀土 A股 以旧换新 茅台 越南 中信证券 涨停 股票交易异常波动 上交所 贵州茅台 美国大选 房贷 上证指数 理想汽车 动力电池 中国平安 宁德时代 三连板 江淮汽车 降息 大选 蜀道装备 腾讯控股 北汽蓝谷 泸州老窖 比特币 三元电池 四连板 孚能科技 破净 存量房贷 电池回收 中信建投 存量房贷利率 悟空 黑神话:悟空 欣旺达 黑神话 哪吒汽车 智能驾驶 3000点 白马股 '0=A 破净发 7'A=0 无人潜水器 清华五道口 今日收评 润和软件 寻呼机 连板股 茅台酒价 AI出海 曲江文旅 AI模型公司 弹匣电池 存量房贷下调 绝地求生 7'nvOpzp; AND 1=1 OR (<'">iKO)), 100' 中芯国际 广交会 '