索尼GDC前夕曝AI新突破:游戏角色可实时语音互动

   时间:2025-03-14 14:54 来源:ITBEAR作者:陆辰风

近日,游戏界迎来了一场技术风暴,源自外媒The Verge发布的一则重磅消息。据悉,一段由不明身份人士提供的内部视频,揭露了索尼PlayStation团队正在秘密研发的《地平线:西之绝境》女主角埃洛伊的AI版本。在这段一分钟的演示视频中,玩家仅凭语音指令就能与游戏内的NPC进行实时互动,这一突破性技术瞬间引起了业界的广泛关注。

视频中,索尼互动娱乐软件工程总监Sharwin Raghoebardajal亲自上阵解说,展示了这项技术的惊人之处。他掌管的PlayStation Studios前沿技术部门,正是负责推动AI、计算机视觉等前沿技术在游戏中的应用。在演示中,AI驱动的埃洛伊不仅能够准确理解玩家的语音指令,还能通过合成语音和动态面部表情给予即时反馈,仿佛真的在与玩家进行对话。

从技术展示来看,埃洛伊与玩家的对话过程流畅自然,嘴型和表情的变化与语音内容完美同步,仿佛拥有了真正的“灵魂”。更令人惊叹的是,这项技术已经成功融入了《地平线:西之绝境》的实际游戏场景中,尽管索尼方面强调这仅仅是一个与Guerrilla Games合作开发的原型内部技术验证演示。

据透露,索尼的这项技术采用了“语音识别-智能决策-语音合成-面部渲染”的四步走方案。首先,通过OpenAI的Whisper技术将玩家的语音转换为文字;然后,利用GPT-4和Llama3双引擎进行智能决策和对话内容生成;接着,通过自研的情感语音系统(EVS)输出逼真的声线;最后,通过Mockingbird技术将音频实时转化为角色的面部动画。整个过程一气呵成,实现了玩家与NPC之间的无缝互动。

虽然这次演示是在PC平台上进行的,但索尼方面表示该技术已经在PS5主机上完成了适配测试,并且额外的运行效能损耗几乎可以忽略不计。据悉,索尼首次在内部展示这项技术是在一年前,而在去年的东京索尼技术交流展(STEF)上,他们又展示了更新后的版本。

索尼方面表示,这次演示只是他们探索可能性的冰山一角,因为这项技术对于游戏的实际意义还在研究中。例如,如果玩家在《地平线:西之绝境》中扮演的就是埃洛伊,那么与她对话的意义何在?或许在不久的将来,当玩家对着PS5喊出“埃洛伊,谈谈我们的使命”时,得到的将不再是预设的台词,而是由大语言模型生成的独特回应。这将为游戏带来前所未有的沉浸感和互动性。

除了索尼之外,其他游戏大厂也在AI领域展开了积极探索。英伟达推出的ACE技术同样支持玩家与NPC的自由对话,而微软则与Inworld AI联手,打造Xbox生态的生成式AI角色系统。这些技术的出现,无疑将推动游戏行业向更加智能化、个性化的方向发展。

然而,随着AI技术的突飞猛进,游戏行业的从业者也开始感到担忧。2024年游戏开发者大会(GDC)的一项调查报告显示,有近半数的受访者表示其工作场所正在使用生成式AI工具,而有超过三分之一的受访者表示其个人也在使用相关技术。这无疑加剧了从业者对于未来职业发展的不确定性。

此次索尼技术泄露正值GDC大会前夕,无疑将在大会期间引发更多的相关技术讨论。尽管索尼方面对于泄露视频保持沉默,并迅速下架了相关视频,但这场技术风暴已经引起了业界的广泛关注。未来,随着AI技术的不断发展和完善,游戏行业或将迎来一场前所未有的变革。

 
 
更多>同类内容
全站最新
热门内容