滚动资讯

OpenAI新版4o逆袭，重返大模型竞技场榜首！

时间：2024-11-21 13:08 来源：ITBEAR作者：赵云飞

在万众瞩目的新加坡OpenAI开发者日活动中，ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o（简称4o）在备受关注的大模型竞技场中一举夺魁，将此前占据榜首的Gemini拉下了马。

此次4o的更新重点在于“创意写作能力”，据官方介绍，新版本能够生成更加自然、吸引人且有针对性的文本，显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化，能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出，作为Canvas功能的一部分，改进写作是一个顶级用例，有望改变人机协作的方式，让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放，但至少在写作方面取得的进展对于实现AGI（通用人工智能）的创造性智能至关重要。

在大模型竞技场的创意写作分榜上，新版4o（ChatGPT-4o-1120）的得分从上一个版本的1365跃升至1402，进步显著。同时，在代码能力、数学能力、困难任务以及风格控制等多个方面，4o也均有所提升，成功从之前的第二名跃升至第一名。

然而，尽管4o的表现亮眼，但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言，希望OpenAI能够尽快放出o1，与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称，OpenAI的更新策略似乎就是每当有其他模型登上榜首时，便迅速推出新版本夺回第一。

尽管4o在创意写作方面取得了显著进步，但仍有网友对其生成的内容进行了测试，并发现系统仍能够准确识别出这些内容为AI所写。不过，也有网友对4o的更新进行了深入研究，并发现OpenAI在系统提示词方面进行了优化，新增了一道护栏，以确保ChatGPT在敏感话题上不会胡说八道。

目前，新版4o已在大模型竞技场中上线，感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版，以及它将如何与其他模型进行竞争，我们拭目以待。

更多>同类内容

《刺客信条：影》Steam上线，战国日本等你探索，发售延期至2025情人节

11-21

快手自研游戏《无尽梦回》公测，赛季制更新与《元气骑士》联动受热捧

11-21

11月游戏审批结果出炉：112款国产+7款进口网游获准上市

11-21

国赛舞台展风采，一职学子叶启航荣获装配式建筑施工智能建造二等奖！

11-21

2024独立游戏新推荐：探索大四生活、恐怖生存与别墅秘密

11-21

国泰动漫游戏ETF联接C基金最新净值涨3.19%，业绩表现如何？

11-21

《潜行者2》全流程攻略：如何在切尔诺贝利禁区生存并揭开秘密？

11-21

《异世界慢生活》登顶免费榜，差异化策略赢得玩家心？

11-20

汤姆猫《汤姆猫闯乐园》独家入驻Apple Arcade，并筹备Vision Pro适配计划

11-20

乌镇上演AI攻防大战，顶尖选手角逐全球十强守护智能安全

11-20

《剑星》1.009补丁大更新：拍照模式来袭，Eve新装亮相！

11-20

11月国产网游审批结果出炉，112款游戏成功上岸

11-20

亲子共融，传统游戏让钢城小学课堂焕发新活力！

11-20

《黑神话：悟空》等作品角逐TGA年度游戏大奖，花落谁家？

11-20

电魂网络股价上涨成交额破亿，主力资金却连续三日净流出

11-20

点击查看更多 +

全站最新

炉石新版本大洗牌！36张卡牌改动后，雷诺四削能否改写格局？

苹果中国开发者收入揭秘：超95%免佣金，大型游戏开发者平均佣金率低于20%

《宝可梦朱紫》日本销量破纪录，超越经典《红绿》登顶！

《有氧拳击3》12月5日登陆Switch，免费试玩今日开启！

iQOO 13评测：全能手游神器，性能与颜值并存的新选择

《爆裂小队》能否搅动国内休闲竞技市场风云？

热门内容

本栏最新

OpenAI新版4o逆袭，重返大模型竞技场榜首！

《刺客信条：影》Steam上线，战国日本等你探索，发售延期至2025情人节

国赛舞台展风采，一职学子叶启航荣获装配式建筑施工智能建造二等奖！

2024独立游戏新推荐：探索大四生活、恐怖生存与别墅秘密

《潜行者2》全流程攻略：如何在切尔诺贝利禁区生存并揭开秘密？

《异世界慢生活》登顶免费榜，差异化策略赢得玩家心？