索尼GDC前夕泄露:AI驱动游戏角色,实现与玩家实时语音互动?

   时间:2025-03-14 13:23 来源:ITBEAR作者:沈瑾瑜

近日,一则关于索尼PlayStation团队正在探索AI技术新边界的消息在游戏圈内引起了轩然大波。据悉,一段由匿名人士泄露的内部视频揭示了《地平线:西之绝境》女主角埃洛伊的AI驱动版本,该版本能够实现与玩家的实时语音对话。

在这段一分钟的演示视频中,玩家可以通过语音指令与游戏内的NPC进行互动,而NPC不仅能够理解玩家的语音输入,还能通过合成语音和动态的面部表情给予即时反馈。这一突破性成果由索尼互娱软件工程总监Sharwin Raghoebardajal亲自解说,他负责的前沿技术部门涵盖了AI、计算机视觉等多个领域。

从技术展示中可以看出,AI驱动的埃洛伊在与玩家对话时,能够做出与语音内容相匹配的嘴型和表情,极大地增强了游戏的沉浸感。值得注意的是,这一原型系统已经成功与《地平线:西之绝境》的实际游戏场景相融合,尽管索尼方面强调这仅仅是一个与Guerrilla Games合作开发的内部技术验证演示。

在技术架构方面,索尼采用了“语音识别-智能决策-语音合成-面部渲染”的四步走方案。玩家的语音首先通过OpenAI的Whisper技术转换为文字,然后调用GPT-4和Llama3双引擎进行决策和对话内容的生成。接着,通过自研的情感语音系统(EVS)输出逼真的声线,最后利用同样自研的Mockingbird技术将音频实时转化为角色的面部动画。

据透露,尽管这次演示是在PC上运行的,但该技术已经在PS5主机上完成了适配测试,并且额外的运行效能损耗几乎可以忽略不计。索尼首次在内部展示这一技术是在一年前,并在去年的东京索尼技术交流展(STEF)上展示了更新版本。

索尼方面表示,这次演示只是探索可能性的冰山一角,因为这项技术对于游戏的实际意义仍然在研究中。例如,当玩家在《地平线:西之绝境》中扮演埃洛伊时,与她对话的意义何在?或许未来玩家可以通过语音指令与NPC进行更深层次的互动,获得更加个性化的游戏体验。

除了索尼之外,其他大厂也在AI领域投入了大量资源。英伟达推出的ACE技术同样支持玩家与NPC的自由对话,而微软也与Inworld AI合作,打造Xbox生态的生成式AI角色系统。随着游戏行业裁员潮的持续,AI技术的突飞猛进也加剧了从业者的担忧。

英伟达和微软的举措表明,AI技术正在成为游戏行业的重要趋势之一。随着技术的不断进步和应用场景的拓展,AI有望为游戏带来更加丰富的互动体验和更加个性化的游戏内容。然而,这也引发了一些从业者对于职业前景的担忧,特别是在游戏开发领域。

此次索尼技术泄露正值游戏开发者大会(GDC)前夕,无疑将在大会期间引发更多的相关技术讨论。尽管索尼方面对泄露视频保持沉默,并迅速要求版权代理下架该视频,但这一事件已经引起了业界的广泛关注。

 
 
更多>同类内容
全站最新
热门内容