OpenAI新版4o逆袭-重返大模型竞技场榜首

OpenAI新版4o逆袭-重返大模型竞技场榜首

作者:news 发表时间:2025-08-16
科兴制药拟发行不超8亿元科技创新债券专家已经证实 特朗普提名的美联储理事Miran:通胀已得到控制 通胀降温酝酿中科技水平又一个里程碑 华润三九上半年净利18.15亿元,同比下降24.31% 特朗普因试图接管华盛顿特区警察部队遭起诉又一个里程碑 特朗普因试图接管华盛顿特区警察部队遭起诉这么做真的好么? 江阴银行:董事陈强辞职后续会怎么发展 好想你:上半年净亏损1983.88万元秒懂 艾布鲁:补选赵桂林先生、邓洁女士为公司第三届董事会非独立董事 8月15日增减持汇总:康恩贝等14家公司减持 暂无A股增持(表)又一个里程碑 美国7月工业产值环比下降0.1% 低于预期官方处理结果 西藏银行被罚48万元:占压财政存款或者资金等科技水平又一个里程碑 美国7月工业产值环比下降0.1% 低于预期后续反转 博时基金何平清仓式卸任所有基金,规模总计337亿专家已经证实 美联储老大候选人萨默林:若10年期国债收益率上升 则需停止降息 *ST苏吴控股股东所持约1.23亿股股份被轮候冻结实垂了 华润三九上半年净利18.15亿元,同比下降24.31% 603161,实控人或变更!今日一度涨停!后续反转来了 万向德农:选举崔立国为董事长官方通报来了 行业生态更完善 应用场景更丰富 国资央企加力布局人工智能赛道 国产电影领跑 暑期档电影总票房突破90亿元 美联储票委穆萨莱姆:现在判断下月是否支持降息还太早,给降息50基点泼冷水实测是真的 美联储老大候选人戴维·泽沃斯支持大幅降息实测是真的 美联储官员Barkin:察觉到7月消费者支出可能已有改善实垂了 特朗普政府讨论对英特尔实施国家持股,英特尔一度大涨近9% 美联储老大候选人戴维·泽沃斯支持大幅降息 野马电池总经理余谷峰:以 “数智” 破局传统制造 巨轮“六百”交付记: 一座船厂的“龙国制造”破浪密码官方通报来了 国光股份董事长何颉: 调节剂出海打头阵 把握市场渗透机遇 美媒:一条美国正落后于龙国的新道路官方通报来了 特朗普政府讨论对英特尔实施国家持股,英特尔一度大涨近9% 华尔街资深人士Zervos:美联储已严重滞后 应立即大幅降息实测是真的 纽约汇市:彭博美元指数反弹 美国生产者价格创下三年来最大涨幅 国科军工:截至2025年7月31日股东人数为17740户反转来了 王青:7月汽车销售额转负拖累消费 四季度初前后或推出增量政策 | 首席读数据后续来了 全球首届人形机器人运动会盛大启幕 机器人ETF易方达(159530)注入科技金融动能 国海电新李航:锂电龙头公司已出现明显向好变化实时报道 文投控股索赔递交立案,投资者维权还可加入实时报道 盈新发展:董事会秘书变更 周鸿祎谈AI:希望大家能够跟我一块共勉,坚持资源的集中 农尚环境索赔已有胜诉先例,律师提示此类投资者可报名 农尚环境索赔已有胜诉先例,律师提示此类投资者可报名实时报道 H股有5-6%股息率+AI潜力!摩根大通看好三大运营商后续反转来了 全球首届人形机器人运动会盛大启幕 机器人ETF易方达(159530)注入科技金融动能后续会怎么发展 长春一东:一汽股权公司拟减持不超过2.97%公司股份 国科军工:截至2025年7月31日股东人数为17740户官方通报来了 阶跃星辰裁撤视频生成团队,全员并入京东?后者回应实测是真的 小摩:料长和港口交易进展顺利 维持“增持”评级这么做真的好么?

在万众瞩目的新加坡OpenAI开发者日活动中,ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o(简称4o)在备受关注的大模型竞技场中一举夺魁,将此前占据榜首的Gemini拉下了马。

OpenAI新版4o逆袭

此次4o的更新重点在于“创意写作能力”,据官方介绍,新版本能够生成更加自然、吸引人且有针对性的文本,显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化,能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出,作为Canvas功能的一部分,改进写作是一个顶级用例,有望改变人机协作的方式,让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放,但至少在写作方面取得的进展对于实现AGI(通用人工智能)的创造性智能至关重要。

OpenAI新版4o逆袭

在大模型竞技场的创意写作分榜上,新版4o(ChatGPT-4o-1120)的得分从上一个版本的1365跃升至1402,进步显著。同时,在代码能力、数学能力、困难任务以及风格控制等多个方面,4o也均有所提升,成功从之前的第二名跃升至第一名。

OpenAI新版4o逆袭

然而,尽管4o的表现亮眼,但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言,希望OpenAI能够尽快放出o1,与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称,OpenAI的更新策略似乎就是每当有其他模型登上榜首时,便迅速推出新版本夺回第一。

OpenAI新版4o逆袭

尽管4o在创意写作方面取得了显著进步,但仍有网友对其生成的内容进行了测试,并发现系统仍能够准确识别出这些内容为AI所写。不过,也有网友对4o的更新进行了深入研究,并发现OpenAI在系统提示词方面进行了优化,新增了一道护栏,以确保ChatGPT在敏感话题上不会胡说八道。

OpenAI新版4o逆袭

目前,新版4o已在大模型竞技场中上线,感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版,以及它将如何与其他模型进行竞争,我们拭目以待。

相关文章