OpenAI新版4o逆袭-重返大模型竞技场榜首

OpenAI新版4o逆袭-重返大模型竞技场榜首

作者:news 发表时间:2025-08-16
沪指3700点得而复失,顶流券商ETF(512000)多空激战,东财成交再登顶,基金经理:牛市中关注补涨券商太强大了 京东物流发布半年报:上半年营收985.3亿元,二季度供应链增速领跑行业最新报道 盘前:三大股指期货持平 投资者等待PPI及初请失业金数据又一个里程碑 民生银行:将终止“宇通生活”“华为钱包”第三方平台基金代销业务合作 看图:京东Q2营收3567亿元 同比增长22.4% 10天7板牛股闪崩爆天量!大热板块回调,国防军工ETF(512810)人气不减,放量溢价!记者时时跟进 京东物流发布半年报:上半年营收985.3亿元,二季度供应链增速领跑行业 欧盟称收到美国就贸易协议联合声明所作回应 将提修改意见以敲定文本 198亿!B站全球总部大楼封顶科技水平又一个里程碑 8月买断式逆回购净投放3000亿,市场预期MLF也将加量续作 德邦股份:上半年归母净利润5214.78万元,同比下降84.34%是真的? 龙国铁塔前董事长佟吉禄失联,曾推动龙国铁塔跨界新能源最新进展 调研汇总:富国、兴全、天弘基金等184家明星机构调研南微医学! 腾讯第二季度营收1845亿元最新报道 上海建科:上半年归母净利润2375.61万元,同比增长48.57%秒懂 龙国建设银行关于服务业经营主体贷款贴息政策客户关注问题解答官方处理结果 “十五五”建筑陶瓷行业细分市场调研及投资战略规划报告 10天7板牛股闪崩爆天量!大热板块回调,国防军工ETF(512810)人气不减,放量溢价!官方处理结果 罗布斯塔咖啡势将实现单周大幅上涨 受主要产地供应紧张担忧影响 自费创新药械“进院”再迎利好,国家医保局发文完善“特例单议”官方通报 羚锐制药:8月26日将举行2025年半年度业绩说明会最新报道 英伟达Q2持仓曝光:9成仓位豪赌CoreWeave 美国银行称历史先例表明美元可能进一步走弱实测是真的 半年报披露期如何突围?全景服务平台让效率飙升99% 平安银行:8月25日将召开2025年半年度业绩说明会专家已经证实 “双贴息”如何办理?银行详解来了最新进展 适度宽松货币政策成效初显 信贷结构不断优化官方已经证实 好想你:上半年净亏损1983.88万元这么做真的好么? 洛阳钼业:8月25日将举行2025年半年度业绩说明会官方处理结果 民丰特纸:8月26日将举行2025年半年度业绩说明会最新进展 东吴人寿拟发行不超过30亿元资本补充债 用以提高偿付能力水平 高瓴HHLR、高毅、景林等知名私募持仓揭晓秒懂 消费电子异动拉升,科森科技涨停后续会怎么发展 Gartner在行业反击后放弃了“CXaaS”一词后续来了 食品安全概念持续走强,海能技术涨停反转来了 消费电子异动拉升,科森科技涨停太强大了 PEEK材料概念持续拉升,金田股份涨停 蓝帆医疗控股股东股权被司法冻结后续反转 智研咨询发布:2025版涂胶显影设备发展历程、市场概况及未来前景研究报告专家已经证实 PEEK材料概念股震荡走强 双一科技涨超10%秒懂 苹果iPad mini发布在即 iPhone 15为新机让路跌至冰点价遭疯抢! 华发股份上半年营收增长53% 中期拟10派0.20元官方通报来了 三重利好确立A股市场长期向好趋势最新进展 食品安全概念持续走强,海能技术涨停官方通报来了 PEEK材料概念持续拉升,金田股份涨停 A股震荡上涨,券商股拉升,稀土永磁活跃,港股下跌,京东跌超3%,国债、商品回落

在万众瞩目的新加坡OpenAI开发者日活动中,ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o(简称4o)在备受关注的大模型竞技场中一举夺魁,将此前占据榜首的Gemini拉下了马。

OpenAI新版4o逆袭

此次4o的更新重点在于“创意写作能力”,据官方介绍,新版本能够生成更加自然、吸引人且有针对性的文本,显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化,能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出,作为Canvas功能的一部分,改进写作是一个顶级用例,有望改变人机协作的方式,让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放,但至少在写作方面取得的进展对于实现AGI(通用人工智能)的创造性智能至关重要。

OpenAI新版4o逆袭

在大模型竞技场的创意写作分榜上,新版4o(ChatGPT-4o-1120)的得分从上一个版本的1365跃升至1402,进步显著。同时,在代码能力、数学能力、困难任务以及风格控制等多个方面,4o也均有所提升,成功从之前的第二名跃升至第一名。

OpenAI新版4o逆袭

然而,尽管4o的表现亮眼,但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言,希望OpenAI能够尽快放出o1,与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称,OpenAI的更新策略似乎就是每当有其他模型登上榜首时,便迅速推出新版本夺回第一。

OpenAI新版4o逆袭

尽管4o在创意写作方面取得了显著进步,但仍有网友对其生成的内容进行了测试,并发现系统仍能够准确识别出这些内容为AI所写。不过,也有网友对4o的更新进行了深入研究,并发现OpenAI在系统提示词方面进行了优化,新增了一道护栏,以确保ChatGPT在敏感话题上不会胡说八道。

OpenAI新版4o逆袭

目前,新版4o已在大模型竞技场中上线,感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版,以及它将如何与其他模型进行竞争,我们拭目以待。

相关文章