在AI技术日新月异的今天,Anthropic公司的Claude 3.5再次展示了其强大的能力。近日,宾夕法尼亚大学沃顿商学院的Ethan Mollick教授对Claude 3.5进行了一系列游戏测试,探索其在非传统任务上的表现。
在「Paperclip Clicker」游戏中,Claude 3.5展现出了令人惊讶的策略制定能力。它不仅能迅速理解游戏规则,还能制定出长期策略,并根据游戏进展进行调整。这一过程中,Claude 3.5的前瞻性思维和洞察力得到了充分展现。
然而,Claude 3.5在游戏中也暴露出了一些短板。尽管它能制定出明智的策略,但在执行过程中也会犯一些低级错误,如计算错误导致策略失效。在尝试自动化游戏时,Claude 3.5的编码能力也显得不足。
在另一款游戏Magic the Gathering Arena的测试中,Claude 3.5的表现同样不尽如人意。尽管它在卡牌选择和调度方面表现出色,但在法力值计算和操作连贯性方面仍存在问题。
尽管存在这些问题,但Claude 3.5在游戏测试中的表现仍然令人印象深刻。它能够为游戏制定长期策略,并坚持执行和改进,这是许多其他AI系统所无法比拟的。同时,这次测试也揭示了与AI智能体合作时需要采用的新方法。
Mollick教授指出,随着AI技术的不断发展,我们需要重新审视与AI的交互方式。AI正在突破聊天框的限制,进入我们的世界,这将为人机交互带来全新的挑战和机遇。
这次测试不仅展示了Claude 3.5的强大能力,也揭示了AI在复杂任务中的潜在问题。随着AI技术的不断进步,我们有理由相信,未来的AI系统将在更多领域展现出更加出色的表现。