大模型挑战《黑神话:悟空》,实力能否超越人类玩家?

   时间:2024-10-21 10:07 来源:ITBEAR作者:任飞扬

在人工智能领域,大模型的应用正不断拓展,从围棋到电脑游戏,其能力边界持续被探索。近期,一项关于多模态大模型在国产游戏《黑神话:悟空》中的研究引起了关注。该研究由淘天集团未来生活实验室的算法工程师团队完成,成果已在论文预印本网站arXiv发布。

《黑神话:悟空》作为动作角色扮演类游戏的代表,被选为测试大模型性能的平台。研究团队面临两大挑战:直接视觉输入和复杂动作任务的执行。为克服这些难题,团队提出了VARP Agent新框架。

![图片1](图片链接1)

VARP Agent框架以游戏截图为输入,通过多模态大模型的推理生成操作代码。这些代码由各种原子命令组合而成,如轻攻击、躲避等。框架还包含情境库、动作库和人类引导库,用于存储和更新知识。

在技术团队设定的任务中,VARP Agent在基本任务和简单到中等难度的战斗中表现出色,胜率高达90%。然而,在面对高难度任务时,其表现仍不如高水平人类玩家。

![图片2](图片链接2)

![图片3](图片链接3)

尽管如此,该研究成果为设计更复杂、能应对更广泛挑战的智能体提供了有益参考。

![图片4](图片链接4)

![图片5](图片链接5)

 
 
更多>同类内容
全站最新
热门内容