近期,AI界掀起了一场轩然大波,一款名为GPT-4.5的大模型在知名排行榜LM Arena上异军突起,一度问鼎榜首,引发了广泛关注和热议。
据悉,GPT-4.5在多项测试中表现出色,特别是在数学、编程、创意写作等领域,其卓越的表现让人们惊叹不已。然而,这款曾经全班垫底的模型如今却大放异彩,不禁让人质疑:大模型竞技场是否出现了什么变故?
面对这样的质疑,网友们纷纷进行实测,结果却惊讶地发现,GPT-4.5的确拥有超凡的情商,能够深刻理解人类的深层意图,无需过多推理便能给出令人满意的回答。这一发现让人们对GPT-4.5的评价发生了翻天覆地的变化。
不仅如此,GPT-4.5在多轮对话、困难提示、指令遵循、长查询等方面也均表现出色,总分高达1411,稳居榜首。然而,好景不长,不久后,另一款大模型Grok-3便以1412的总分微弱优势超越GPT-4.5,夺得榜首之位。
尽管如此,GPT-4.5的惊艳表现仍然给人们留下了深刻的印象。它不仅情商高,让人如沐春风,而且在智商测试中也表现出不俗的实力。虽然其线下测试智商为97,线上门萨测试智商为94,并未超越OpenAI的o1 Pro、o3 mini和o1-preview等前辈,但已经与人类平均智商水平相当。
在实际应用中,GPT-4.5也展现出了其独特的优势。有网友晒出了与GPT-4.5的对话记录,其中GPT-4.5对于用户意图的理解令人惊喜。例如,在面对一个关于国际象棋的粗俗玩笑时,GPT-4.5能够迅速接住梗并给出适宜的回答,而Claude Sonnet和Grok 3等模型则未能理解。
然而,GPT-4.5并非文武双全。在WebDev Arena实时AI编程竞赛中,GPT-4.5并未参赛,而OpenAI的模型表现也并非最佳。GPT-4.5的高昂使用成本也成为了其推广的一大障碍。与GPT-4o相比,GPT-4.5的API价格大幅上涨,令许多用户望而却步。
尽管如此,GPT-4.5的发布仍然具有重要意义。它是OpenAI从GPT-4o向GPT-5过渡的关键桥梁,旨在留住付费用户,防止其在GPT-5发布前转向竞争对手。同时,GPT-4.5的发布也反映了市场竞争的加剧,OpenAI面临着来自其他优秀模型的巨大压力。
未来,随着技术的不断进步和市场的不断变化,AI界或将迎来更多惊喜和挑战。而GPT-4.5作为其中的佼佼者,也将继续发挥其独特优势,为人们带来更多便利和惊喜。