在人工智能界,一款名为DeepSeek的模型悄然迎来了它的新篇章。经过两个月的沉寂,DeepSeek团队在不声不响中,于Hugging Face平台上发布了一个名为DeepSeek-V3-0324的升级版模型。
这款新模型的参数规模达到了6850亿,与前一版本V3(6710亿参数)相比,虽增幅不大,但它采用了更先进的MoE架构,并改用了更为开放的MIT开源协议。据官方介绍,DeepSeek-V3-0324主要针对推理能力和前端开发能力进行了显著加强,其写作风格也与R1实现了对齐,同时还包含了一些其他细微的优化。
用户现在只需访问DeepSeek的官方网站,关闭深度思考模式,即可直接体验V3-0324版本。尽管这次更新并非众人翘首以盼的V4或R2版本,且官方未发布任何相关公告,但V3-0324的上线仍然引起了广泛关注。
不少用户反馈,V3-0324的代码能力几乎可以与著名的Claude模型相媲美。一上线,它就迅速登上了Hugging Face的趋势榜单。在KCORES的测评中,V3-0324的代码能力得分高达328.3,超过了普通版Claude 3.7 Sonnet的322.3分,仅略低于Claude 3.7 Sonnet思维链版本的334.8分,位居第三。尤为排名靠前的模型中,开源免费的寥寥无几,V3-0324显得尤为突出。
V3-0324上线不到一天,就吸引了大量用户进行测评。在许多用户的手中,V3-0324的表现堪称惊艳,甚至被认为在性能上超越了o3-mini和Claude 3.7 Sonnet。在经典的小球弹跳测试中,V3-0324生成的结果最为准确,得到了用户的高度评价,称其表现“如同排名第一的非推理模型”。
有用户尝试让V3-0324生成一个网页,结果模型一口气写出了800多行代码,且运行无误,展现了其强大的实力。在评论区,另一位用户仅简单指令要求编写登录页面,V3-0324同样生成了一个完整的登录页面,令人赞叹不已。
然而,并非所有测试都一帆风顺。在一项画板生成任务中,V3-0324的表现并不如Claude 3.7 Sonnet,尤其是在UI设计和功能完整性上存在一定差距。尽管如此,这并未影响V3-0324在其他测试中的卓越表现。
综合来看,V3-0324在代码能力上相比V3有了显著提升,甚至在某些测试中能够比肩Claude 3.7 Sonnet。尽管尚未完全超越Claude 3.7 Sonnet,但考虑到V3-0324的开源属性和更为亲民的价格(百万tokens输入输出价格分别为2元和8元,远低于Claude 3.7 Sonnet的36.6元和108.9元),其性价比无疑更具吸引力。
DeepSeek官方随后也发文正式介绍了这次小更新,并透露在数学、代码类相关评测上,V3-0324的表现甚至超过了OpenAI目前最强大的非推理模型GPT-4.5。这一消息无疑为DeepSeek的未来增添了更多期待。