索尼GDC前夕泄露:AI驱动游戏角色,实时语音互动成真?

   时间:2025-03-14 11:40 来源:ITBEAR作者:陆辰风

近日,游戏界迎来了一次技术曝光的震撼,一段据称由匿名人士提供的内部视频在网络上引起了轩然大波。视频展示了索尼PlayStation团队正在研发的一项前沿技术——一个由AI驱动的《地平线:西之绝境》女主角埃洛伊。

在这段一分钟的演示视频中,玩家可以通过语音指令与游戏中的NPC进行实时互动,这一创新引发了业界对AI技术可能彻底改变传统游戏交互模式的广泛讨论。视频中,索尼互娱软件工程总监Sharwin Raghoebardajal亲自解说,展示了这一技术的突破性成果。AI驱动的埃洛伊不仅能够理解玩家的语音指令,还能通过合成语音和动态面部表情做出即时回应。

从技术展示中可以看出,角色在与玩家对话时,能够自然地做出与对话内容相匹配的嘴型和表情,大大增强了游戏的沉浸感和互动性。值得注意的是,这一原型系统已经成功与《地平线:西之绝境》的实际游戏场景相融合,尽管索尼方面强调这只是一个与Guerrilla Games合作开发的内部技术验证演示。

在技术架构方面,索尼采用了“语音识别-智能决策-语音合成-面部渲染”的四步走方案。玩家的语音首先通过OpenAI的Whisper技术转换为文字,然后调用GPT-4和Llama3双引擎进行智能决策和对话内容生成。接下来,通过自研的情感语音系统(EVS)输出逼真的声线,最后通过Mockingbird技术将音频实时转化为角色的面部动画。

据透露,尽管这次演示是在PC上运行的,但该技术已经在PS5主机上完成了适配测试,并且额外的运行效能损耗几乎可以忽略不计。索尼首次在内部展示这项技术是在一年前,并在去年的东京索尼技术交流展(STEF)上展示了更新版本。

这一技术的曝光无疑将对游戏行业产生深远影响。除了索尼之外,英伟达和微软等大厂也在AI领域投入了大量资源。英伟达推出的ACE技术同样支持玩家与NPC的自由对话,而微软则与Inworld AI合作,打造Xbox生态的生成式AI角色系统,并自研Muse AI模型以辅助开发者快速构建游戏场景。

随着游戏行业裁员潮的持续,AI技术的突飞猛进也加剧了从业者的担忧。根据2024年游戏开发者大会(GDC)的一项调查报告显示,49%的受访者表示其工作场所正在使用生成式AI工具,31%的受访者表示其个人也正在使用相关技术。而此次索尼技术的泄露恰好在GDC大会前夕,无疑将在大会上引发更多的相关技术讨论。

尽管索尼方面对泄露视频保持沉默,并迅速通过版权代理下架了视频,但这一事件已经引起了业界的广泛关注。AI技术对于游戏的实际意义仍在研究中,但毫无疑问的是,这一技术的出现将为游戏行业带来前所未有的变革。

 
 
更多>同类内容
全站最新
热门内容