OpenAI o3震撼登场,AI通往通用智能之路再迈大步!

   时间:2024-12-21 09:02 来源:ITBEAR作者:沈瑾瑜

在科技界的万众瞩目下,OpenAI的12天直播盛宴于今日凌晨2点迎来了震撼人心的终章。在这场科技马拉松的尾声,OpenAI不负众望地推出了其最新力作——OpenAI o3,宛如一位圣诞归来的奥特曼,为全球的科技爱好者们献上了压轴大戏。

OpenAI o3的问世,再次将人工智能模型的能力推向了新的巅峰,向全世界展示了OpenAI在科技王座上的不可撼动地位。这一壮举不禁让人回想起OpenAI研究员在o1发布前的豪言壮语:“我们通往通用人工智能(AGI)的路上,已经没有任何阻碍了。”有趣的是,OpenAI此次直接跳过了o2的命名,原因竟是为了避免与英国电信服务提供商O2的版权或商标冲突,直接迈入了o3时代。这一消息一出,科技圈瞬间沸腾。

o3的能力之强,对现有的所有模型几乎构成了降维打击。从软件工程考试(SWE-Bench Verified)到全球著名的编码竞赛平台Codeforces,o3都展现出了超乎寻常的实力。在SWE-Bench Verified中,o3以71.7%的成绩超越了o1,而在Codeforces上,o3的得分高达2727分,相当于整个榜单的第175名,成功超越了99.99%的人类选手。这一成就,无疑让OpenAI在通往AGI的道路上又迈出了坚实的一步。

在数学竞赛AIEM 2024和博士级科学考试GPQA Diamond中,o3同样表现出色。AIEM 2024中,o3接近满分的成绩标志着AI首次达到这一高度。而在博士级科学考试中,o3也取得了显著的进步。在FrontierMath这一由60多位顶尖数学家合作开发的数学基准测试中,o3的成功率更是达到了25.2%,远超之前GPT-4和Gemini 1.5 Pro等模型的表现。这一成就,无疑让o3在人工智能领域独树一帜。

尤为在ARC-AGI这一旨在通过抽象和推理任务测试AI系统能力的基准测试中,o3的得分达到了恐怖的87.5%。这一成绩不仅远超过去几代模型的评分,甚至已经接近了人类的阈值分数85%。这一成就,无疑再次证明了OpenAI在人工智能领域的领先地位。

然而,尽管o3强大无比,但目前仅对OpenAI的红队开放。对于科技巨佬们来说,这或许是一个难得的机会去申请体验这一划时代的人工智能模型。同时,OpenAI还基于o3训练了三个小尺寸的模型,其中o3-mimi预计将在1月底对外开放。这一消息无疑让广大科技爱好者们充满了期待。

回顾这12天的直播历程,从满血o1的上线到ChatGPT Pro会员的推出,再到Sora的正式发布和ChatGPT Canvas的全员开放,每一天都充满了惊喜和期待。然而,在这漫长的马拉松中,也不乏一些平淡无奇的时刻。但好在,今天的o3发布如同一道曙光,照亮了之前的阴霾。这场科技盛宴虽然落幕,但留给我们的却是无尽的思考和期待。

 
 
更多>同类内容
全站最新
热门内容