近日,游戏界迎来了一次前所未有的技术曝光,源自外媒The Verge发布的一段由未知人士提供的内部视频。这段视频揭示了索尼PlayStation团队正在秘密研发的《地平线:西之绝境》女主角埃洛伊的AI驱动版本,瞬间在游戏业界掀起了轩然大波。
视频中,索尼互娱软件工程总监Sharwin Raghoebardajal亲自上阵,向观众展示了这一前沿技术的震撼效果。通过语音指令,玩家能够与游戏中的NPC埃洛伊进行实时对话,而埃洛伊不仅能够理解玩家的语音输入,还能通过合成语音和生动的面部表情给予即时回应。这一突破性成果无疑挑战了传统游戏交互模式的极限。
在技术上,索尼采用了“语音识别-智能决策-语音合成-面部渲染”的四步走策略。首先,利用OpenAI的Whisper技术将玩家的语音转换为文字,随后调用GPT-4和Llama3双引擎进行智能决策和对话内容生成。接下来,通过索尼自研的情感语音系统(EVS)输出逼真的声线,最后通过Mockingbird技术将音频实时转化为角色的面部动画。整个过程流畅自然,仿佛埃洛伊真的在与玩家进行对话。
值得注意的是,这一原型系统已经与《地平线:西之绝境》的实际游戏场景实现了无缝融合。尽管索尼强调这仅仅是一个与Guerrilla Games合作开发的内部技术验证演示,但这一技术的潜力已经引起了业界的广泛关注。
随着这一技术的曝光,人们开始思考AI对游戏行业可能带来的深远影响。如果玩家在《地平线:西之绝境》中扮演的是埃洛伊,那么与她进行对话的意义何在?或许,未来的游戏中,玩家将不再听到预设的台词,而是由大语言模型生成的独特回应。当NPC学会了“思考”,游戏开发者将如何规划它们的“意识”?这一技术是否会导致配音演员的失业?这些问题都成为了业界关注的焦点。
除了索尼之外,其他大厂也在AI领域展开了积极探索。英伟达推出的ACE技术同样支持玩家与NPC的自由对话,而微软则与Inworld AI联手,打造Xbox生态的生成式AI角色系统。这些技术的不断涌现,无疑将推动游戏行业向更加智能化、个性化的方向发展。
然而,随着AI技术的突飞猛进,游戏行业的从业者也面临着前所未有的挑战。2024年游戏开发者大会(GDC)的一项调查报告显示,近半数的受访者表示其工作场所正在使用生成式AI工具,而超过三成的受访者则表示个人也正在使用相关技术。这一趋势无疑加剧了从业者对未来职业发展的担忧。
在GDC大会前夕,索尼的这次技术泄露无疑将在大会上引发更多的相关技术讨论。尽管索尼对此保持沉默,并迅速下架了泄露视频,但这一事件已经引起了业界的广泛关注。未来,随着AI技术的不断发展和完善,游戏行业或将迎来一场前所未有的变革。