网界世界电子杂志手机网站站内搜索

网界世界！

滚动资讯

当前位置：游戏世界 > 动漫资讯 > 正文内容

Llama 4陷作弊风波，Meta AI紧急澄清：真相究竟如何？

时间：2025-04-08 19:35 来源：ITBEAR作者：朱天宇

近日，科技界掀起了一场关于meta最新推出的开源大模型Llama 4的风暴。4月5日，这家美国科技巨头宣布，其新一代大模型Llama 4已面世，包含Scout和Maverick两个基于混合专家（MoE）架构的版本，而更为强大的Llama 4 Behemoth仍在训练中。

meta官方宣称，Llama 4在多项基准测试中表现卓越，尤其是Llama 4 Behemoth，其在多个测试中的成绩超越了GPT-4.5、Claude Sonnet 3.7和Gemini 2.0 Pro等行业顶尖封闭模型。meta声称，Llama 4家族使用了混合专家架构，原生支持多模态，堪称“全能选手”。

然而，就在Llama 4发布后不久，质疑声如潮水般涌来。开发者们实测后发现，Llama 4的实际效果远不如宣传中那般惊艳，甚至问题频出。特别是在编程等特定任务上，Llama 4的表现并不理想。Menlo Ventures的风险投资人迪迪·达斯直言，Llama 4实际上是一个糟糕的编程模型。

不仅如此，开发者们还质疑meta存在作弊“刷榜”的行为。他们指出，meta在大模型竞技场上使用的并非供开发者使用的Llama 4版本，而是针对人类偏好进行优化的定制模型。大模型竞技场官方也证实了这一点，并要求meta对此事作出澄清。

知名科技媒体TechCrunch也发表文章，指出meta新AI模型的性能测试“具有一定误导性”。文章认为，meta针对基准测试优化特定版本去打榜，却给开发者提供“基础版”的做法，让开发者难以依据榜单排名准确预估模型在实际应用场景中的真实表现。

面对外界的质疑，meta生成式AI副总裁艾哈迈德·阿尔·达赫勒在社交平台X上公开回应，坚称相关说法毫无事实依据。他解释称，部分用户在使用Llama 4模型时遭遇了质量不稳定问题，这是由于模型发布后仍在调整阶段，预计需要几天的时间来完善所有公开版本。

meta首席AI科学家、图灵奖得主Yann LeCun也转发了达赫勒的帖子，为Llama 4声援。然而，这场风波并未因此平息。一则自称由meta内部员工发布的爆料帖子，再次将meta推上了风口浪尖。该员工爆料称，Llama 4模型训练测试集作弊，自己已因此辞职。

爆料员工透露，尽管团队反复努力训练，Llama 4的内部模型性能始终无法达到开源SOTA基准，且差距明显。为达成目标，公司领导层提出在训练后期将各种基准测试的测试集数据混入训练或微调数据中。这一说法引发了广泛关注和讨论。

不过，由于爆料人并未实名，该帖子的真实性尚无法核实。meta的多位内部员工也在评论区实名进行辟谣，称团队绝不存在针对测试集过拟合训练的情况。这场关于Llama 4的争议，仍在持续发酵中。

更多>同类内容

任天堂Switch 2卡带：继续“苦”味防误食，你还敢尝试吗？

04-08

{友徐庶强度解析：军八表现中规中矩，却成刘焉神器？）

04-08

国家文创实验区投资大会签约三大项目，网游孵化、科幻体验成亮点

04-08

《攻城掠地》魏延副本通关秘籍：精英阵容与战术布局全揭秘

04-08

暗影骑士·擎7系列震撼登场，硬核评测带你领略50系AI战神风采！

04-08

DNF阿修罗110级加点秘籍：实战数据与高端玩家推荐全解析

04-08

Epic 移动游戏商店送福利，《Doodle Kingdom：Medieval》限时免费领

04-08

游戏行业8日资金流向揭秘：主力净流出6.52亿，哪些公司受影响最大？

04-08

暗影骑士·擎7系列震撼登场，50系AI战神性能究竟有多强？

04-08

《修罗武神手游升阶版》：九州大陆修真路，热血战斗等你闯！

04-08

任天堂Switch 2不引入系统级成就，塞尔达系列将有独立成就管理应用

04-08

《魔兽世界》奥蕾莉亚·风行者：神秘图像背后的故事，你了解多少？

04-08

《黑神话：悟空》衍生图书《影神图》4月10日发售，收藏级画集来袭！

04-08

红魔10 Air发布会定档4月16日，史上最轻薄全屏旗舰来袭！

04-08

小游戏《曙光重临》领跑“帕鲁like”赛道，大厂为何落后？

04-08

点击查看更多 +

全站最新

Llama 4陷作弊风波，Meta AI紧急澄清：真相究竟如何？

Llama 4陷作弊风波，Meta AI紧急澄清：真相究竟如何？

率土青春服火爆街头！SLG新纪元：零氪拼策略，能否重塑游戏生态？

率土青春服火爆街头！SLG新纪元：零氪拼策略，能否重塑游戏生态？

任天堂重申：AI非游戏开发主角，人类创意仍是灵魂所在

任天堂重申：AI非游戏开发主角，人类创意仍是灵魂所在

Switch 2游戏高价引热议，《博德之门3》总监呼吁灵活定价

Switch 2游戏高价引热议，《博德之门3》总监呼吁灵活定价

任天堂Switch 2卡带：继续“苦”味防误食，你还敢尝试吗？

任天堂Switch 2卡带：继续“苦”味防误食，你还敢尝试吗？

迷宫探险必备！传奇迷宫攻略策略与实战技巧深度剖析

迷宫探险必备！传奇迷宫攻略策略与实战技巧深度剖析

热门内容

本栏最新

Llama 4陷作弊风波，Meta AI紧急澄清：真相究竟如何？

Llama 4陷作弊风波，Meta AI紧急澄清：真相究竟如何？

任天堂Switch 2卡带：继续“苦”味防误食，你还敢尝试吗？

任天堂Switch 2卡带：继续“苦”味防误食，你还敢尝试吗？

{友徐庶强度解析：军八表现中规中矩，却成刘焉神器？）

{友徐庶强度解析：军八表现中规中矩，却成刘焉神器？）

国家文创实验区投资大会签约三大项目，网游孵化、科幻体验成亮点

国家文创实验区投资大会签约三大项目，网游孵化、科幻体验成亮点

《攻城掠地》魏延副本通关秘籍：精英阵容与战术布局全揭秘

《攻城掠地》魏延副本通关秘籍：精英阵容与战术布局全揭秘

暗影骑士·擎7系列震撼登场，硬核评测带你领略50系AI战神风采！

暗影骑士·擎7系列震撼登场，硬核评测带你领略50系AI战神风采！

《游戏世界》电子杂志专注于为广大玩家提供最新、最热门的游戏新闻、评测和预告。游戏世界（www.yxi.com.cn）所有稿件免费开放转载，转载请务必保留版权，并注明来源网址。
合作微信：netspread（注明:游戏世界）
Copyright © 游戏世界 2012-2023 www.yxi.com.cn All rights reserved. 鲁ICP备2022032383号-10