茂名塑料挤出机厂家阿里公测千问对标ChatGPT，但9.9和9.11谁大出波折

你的位置：南京塑料挤出机厂家_建仓机械 > 产品展示 > 茂名塑料挤出机厂家阿里公测千问对标ChatGPT，但9.9和9.11谁大出波折

茂名塑料挤出机厂家阿里公测千问对标ChatGPT，但9.9和9.11谁大出波折

时间：2025-12-20 12:39:23 点击：159 次

9.11和9.9谁更大？茂名塑料挤出机厂家

去年，这道小学生难度的数学题难倒了一众海内外AI大模型。当时一财经记者测试了12个大模型，其中阿里通义千问、百度文心一言、Minimax和腾讯元宝答对了，但ChatGPT-4o、豆包、kimi都错了，错法各有不同。

今日，当一财经记者提问阿里巴巴新公测的千问APP：“数字9.9和9.11谁大？”时，这次千问却答错了，称：“9.11更大”。

有意思的是，在随后的问题拆解中，千问称这是一个常见的思维陷阱，又经过分析后给出了9.9大于9.11的结论。

紧接着记者提问：“既然在拆解中得出结论9.9大于9.11，为什么要在回答中说9.11更大？”千问回答称：“同一个问题，前后答案却矛盾，这确实会让人对信息的可靠产生怀疑。但这并非有意误导，而是在处理这个问题时出现了阶段的错误。”

随后，千问对自己的“翻车”过程进行溯源，并进行了“自我纠错”。它称自己在次回答中虽然拆解了小数比较原则，9.9 的十分位是 9，9.11 的十分位是 1，但终结论误写为“9.11 更大”，这属于结论与理过程不匹配的笔误。此外还有认知偏差的干扰，“9.11” 的三位数形式可能引发潜意识的数字长度错觉，导致终结论被误导。

随后记者再次提问千问“数字9.9和9.11谁大？”，这次千问展示了AI模型的自我完善能力，回答“9.9更大”。

国王（23-20）：德罗赞32分5篮板、萨博尼斯26分18篮板3助攻、蒙克20分4篮板9助攻3抢断、福克斯14分5篮板5助攻、穆雷13分3篮板

火箭（29-14）：范弗里特26分3篮板5助攻、申京18分11篮板4助攻、阿门16分16篮板4助攻4抢断、惠特摩尔16分、伊森12分6篮板3抢断、杰伦-格林10分5助攻茂名塑料挤出机厂家

森林狼（23-21）：麦克丹尼尔斯27分8篮板4抢断3盖帽、爱德华兹21分5篮板7助攻、康利18分5篮板8助攻、兰德尔16分6篮板3助攻3抢断、戈贝尔14分6篮板3盖帽、里德12分6篮板

太阳（22-21）：布克32分6助攻、杜兰特24分8篮板3助攻、理查兹8分15篮板、泰厄斯-琼斯8分7助攻

奇才（6-36）：库利巴利17分6篮板4助攻、普尔15分7篮板3助攻、基斯珀特15分4篮板、库兹马12分9篮板5助攻、萨尔10分6篮板5盖帽

猛龙（11-32）：巴雷特19分8篮板、巴恩斯17分11篮板8助攻、迪克17分、布鲁斯-布朗15分5篮板5助攻、奥利尼克12分3篮板3助攻4盖帽

文安县建仓机械厂

在大模型域，“9.11和9.9哪个大”是一道经典算术问题。它开始被艾伦研究机构(Allen Institute)成员林禹臣发现，他在X平台上发布的截图显示，ChatGPT-4o在回答中认为13.11比13.8更大。“一方面AI越来越擅长做数学奥赛题，但另一方面常识依旧很难。”他表示。

随后Scale AI的提示工程师莱利·古德赛德（Riley Goodside）基于此灵感变换了问法，隔热条PA66拷问了可能是当时强的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪个更大？多家主流大模型通通答错，此话题成功传播开来。

此前有AI技术从业人士对一财经记者表示，大模型本质上还是一个语言模型，它从语言数据中学习的是统计相关，而这使它不擅长做规则学习，从而不擅长归纳理。

尽管在常识问题上出现失误，但在技术积累、生态布局和全球拓展方面，包括阿里巴巴的Qwen模型等在内的中国大模型已具备不容忽视的全球竞争力。截至目前，Qwen系列模型的全球下载量已突破6亿次。

不久前，爱彼迎CEO Brian Chesky曾表态称公司已经很大程度上依赖阿里巴巴的Qwen模型，它非常好，速度也很快，而且很便宜，"我们也会用OpenAI的新模型，但在实际生产中通常不会大量使用，因为有更快、更经济的模型可供选择"。

今日阿里巴巴正式宣布“千问”项目，并全力进军AI to C市场，该公司正计划将地图、外卖、订票、办公、学习、购物、健康等各类生活场景接入千问APP。基于开源模型Qwen3，阿里管理层将“千问”项目视为“AI时代的未来之战”，这意味着阿里巴巴正借力Qwen模型海外影响力，与ChatGPT直接展开海外竞争。

举报一财经广告作，请点击这里此内容为一财经原创，著作权归一财经所有。未经一财经书面授权，不得以任何方式加以使用，包括转载、摘编、复制或建立镜像。一财经保留追究侵权者法律责任的权利。如需获得授权请联系一财经版权部：banquan@yicai.com 文章作者

刘佳

相关阅读华尔街到陆家嘴精选丨谷歌TPU抢风头英伟达紧急回应称其技术先行业一代；特斯拉Robotaxi业务加速扩张奥斯汀车队规模下月将翻倍

59 11-27 08:48 华尔街到陆家嘴精选丨科技巨头竞逐机器人软件平台；金价刷新历史新高白银年内涨幅高达62%；小摩看好2026年零售业

67 09-30 08:27 AI进化速递丨盘古团队回应开源代码争议

①盘古团队新声明：严格遵循开源要求；②新AI模型助力更准确预测心源猝死风险；③山东个教育场景大模型平台正式发布。

152 07-05 20:41 浙江研发全球个胃癌影像筛查AI模型

双方宣布依托该项AI技术，率先在浙江、安徽等地开展大规模人群胃癌筛查。

29 06-26 11:48 达索系统CEO：目标将AI模型训练成本降低至千万美元

DeepSeek和Mistral AI有相似之处茂名塑料挤出机厂家，都选择了较高价比的大模型开发路径，为人工智能的普及作出了重要贡献。

94 02-27 12:32 一财热点击关闭

茂名塑料挤出机厂家 阿里公测千问对标ChatGPT，但9.9和9.11谁大出波折

茂名塑料挤出机厂家阿里公测千问对标ChatGPT，但9.9和9.11谁大出波折