OpenAI推出不到一周的最新旗舰模型没能等来“好评如潮 ”。
近日 ,OpenAI在十周年之际发布了GPT-5.2系列模型,官方数据显示其在GDPval等专业基准测试中超越人类专家,是迄今为止在“专业知识工作方面”表现最好的模型 。
据OpenAI官方披露,GPT-5.2在多领域实现技术突破:GDPval测试中覆盖44个职业的任务表现70.9%优于顶尖专家 ,SWE-bench Pro编程测试获55.6%的SOTA成绩,还将幻觉率较GPT-5.1降低38%。该公司CEO山姆·奥特曼称其为“许久以来最大的升级”,并透露计划2026年1月解除应对谷歌竞争的“红色警报”。
但该模型上线后遭到大量用户吐槽 ,认为其从常识问答到情感交互,“智商不稳定 ”。
SimpleBench常识推理测试显示,GPT-5.2得分低于Anthropic发布的Claude Sonnet 3.7 ,甚至在“garlic有几个r”的基础问题上反复出错——有用户三次测试仅一次答对,而谷歌的Gemini 3.0等竞品均稳定通关 。该测试旨在评估大模型在处理普通人认为简单,但对机器而言充满挑战的逻辑推理任务的能力。前AWS总经理Bindu Reddy直言 ,“不值得从GPT-5.1升级”。
网友晒出GPT-5.2在SimpleBench上的成绩单 。
一些编程爱好者则发现,GPT-5.2生成的交通灯模拟代码画面仅达“黑白火柴人级别 ”,蒙娜丽莎ASCII艺术创作效果远逊于GPT-4o。情感交互中有用户倾诉“恐慌发作” ,竟收到“很高兴听到这个消息”的回复,安慰失宠孩童时则机械强调“生物都会停止运作 ”,缺乏此前版本的亲和力和自然表达。
此外,该版本在处理连续对话时不稳定 ,甚至在明确选择“高级思考模式”时也会返回低质量的自动响应,令用户不得不重新调整使用方式 。
还有用户表示,GPT-5.2的安全策略实施过于严格 ,在执行普通且无风险的请求时也会拒绝操作并给出无关的安全提示。
有观察人士指出,这轮差评潮背后存在几重因素。一方面,OpenAI推广时着重强调GPT-5.2的专业能力和基准测试成绩 ,但普通用户更关注日常对话 、流畅性和创造性体验,两者的期望存在错位;另一方面,由于竞争加剧和内部发布节奏加快 ,有观点认为该版本可能发布过早,尚未充分优化在关键使用场景中的稳定性与一致性,因此用户的实际感受出现明显落差 。
截至发稿 ,OpenAI尚未就这轮用户反馈作出公开回应,但公司在官方资料中表示,会持续改善用户体验、优化安全策略,并根据用户反馈推进后续版本的迭代。
当前 ,OpenAI仍面临来自谷歌的巨大竞争压力。谷歌此前推出的Gemini 3在编程、多模态理解等关键企业应用场景上实现了对ChatGPT的性能超越 。11月,谷歌宣布Gemini月活跃用户已突破6.5亿,较7月报告的4.5亿实现大幅增长 ,而OpenAI披露的周活跃用户数接近8亿。
为此,奥特曼曾发布“红色代码”警报,决定暂时搁置包括Sora视频生成器在内的长期研发项目 ,转而在短期内全力通过提升用户活跃度来巩固ChatGPT的大众市场地位。但急转直下的口碑或在很大程度上影响ChatGPT的使用率,OpenAI能否拿出更强有力的“武器 ”反击谷歌仍存在不确定性。
最好用的股票软件排名:杠杆炒股哪个平台好-破解企业“基础研究不敢投”困局 上海发布全国首个支持政策
股票维权平台哪个正规:炒股杠杆比率-中国对美海运价坐“过山车” 最新数据止跌回升折射需求变化
炒股10倍杠杆平台:股票软件哪个比较好-股价暴涨26%!知名银行龙头突然宣布拟私有化
a股怎么用杠杆:买股票开户哪个平台好-三家官网已变黑白!中金黄金市值蒸发超50亿 6名学生遇难最新细节披露
什么是经营杠杆:在哪个平台买股票好-知名大厂被约谈?官方最新回应!
炒股杠杆平仓是什么意思:股票配资平台哪个最好-全球白银市场正经历一场“流动性风暴”
恒正网app-配资股票网_10倍杠杆配资平台_浙江配资网提示:文章来自网络,不代表本站观点。
恒正网app-配资股票网_10倍杠杆配资平台_浙江配资网㉖股票配资公司注重与投资者的沟通,会定期向投资者报告投资组合的表现,解释投资策略和决策依据,增强投资者对投资活动的理解和信任。
3月24日,AI眼镜概念股开盘拉升,瀛通通讯直线涨停,明月镜片涨超10%,比依股份、博士眼镜、恒玄科技、国光电器等跟涨。...
记者王珍中国国际经济交流中心副理事长、国务院发展研究中心原副主任王一鸣周一在“中国发展高层论坛2025...
记者辛圆3月25日,博鳌亚洲论坛旗舰报告《亚洲经济前景及一体化进程2025年度报告》(以下简称《报告》...
界面新闻记者|冯赛琪12月20日,在MM艺术品指数媒体发布会上,MM全球印象派价格指数及全球当代艺术品价格指...
记者|赵阳戈年初,证监会就修改《证券发行与承销管理办法》部分条款向社会公开征求意见,市场也将注意力投向了...
界面新闻记者|龙力开年两个多月,不少头部量化私募都在积极“上新”。Wind数据显示,截至3月17日,...
当地时间3月24日,特斯拉美股涨幅扩大至5%,现报262.055美元/股。...
近日,开源证券大连分公司遭大连证监局处罚,暂停其办理需要合格投资者认定相关业务六个月。该惩处力度在近年来券商分支机构中并...
文/吴治邦3月24日早盘,在2024年年底压哨实施完毕重整计划的*ST花王股价继续跌停。自2025年1月...
国海富兰克林基金国富深化价值基金经理刘晓日前发表了对 2025 年市场的展望。刘晓指出,国内经济正处于复苏通道,市场大幅...
2025年3月24日下午三点A股收盘后,港股科技板块持续走强至四点十分收盘。消息面上,一方面美元相对于人民币连续3个交易...
央行公告,为保持银行体系流动性充裕,更好满足不同参与机构差异化资金需求,自本月起中期借贷便利(MLF)将采用固定数量、利...
3月24日,易方达国证自由现金流ETF公开发售。该产品跟踪国证自由现金流指数,这个指数是什么?有哪些优势?投资价值如何?...
记者闫桂花 王珍中国社会科学院学部委员、中国社会科学院原副院长高培勇周日在“中国发展高层论坛2025年...
2025年3月25日,倍轻松(688793.SH)公告称,公司股东宁波倍松投资有限公司(简称“宁波倍松”)拟通过大宗交易...