近日,网易有道宣布了一项重大技术突破,成功研发出基于自研“有道翻译大模型2.0”的140亿参数小领域专用模型,这一进展标志着有道在翻译技术领域的又一次重要迭代。
该模型不仅保持了高水平的翻译质量,还显著降低了计算资源消耗和部署成本,使其更易融入现有系统和设备,拓宽了技术的应用边界。用户现已能在有道词典、有道翻译及有道翻译官等产品中体验到这一技术升级带来的便利,自由选择标准模型或高级模型,并享受两者间的无缝切换。
网易有道已将这一大模型技术融入其智能硬件产品线,其中,有道词典笔X7系列已率先完成升级,其他设备也将陆续跟进。在数据质量、领域适应性和算法优化等多重因素的作用下,这一140亿参数的小领域专用模型展现出了卓越的翻译性能。
网易有道通过高质量翻译语料库的精细标注,为模型提供了丰富的数据支持,这些数据由资深英语专家和专业译者共同完成,确保了模型在处理多样化翻译场景时的准确性。在算法层面,有道基于“有道”大模型进行了二次预训练,打造出既专业又精准的翻译基础模型。同时,采用大模型蒸馏、模型融合及在线直接偏好优化(DPO)等技术,有效避免了灾难性遗忘问题,大幅提升了翻译操作的效率、准确性和流畅度。
为了全面评估模型性能,网易有道开发了一款名为“奖励模型”的翻译评估工具,该工具利用累积的翻译数据为评价提供可靠的量化依据,并结合全面的手工评估框架,实现了对翻译结果的多维度分析。内部测试显示,相较于前代模型,这一新模型在包括人文、商业、生活服务、医疗健康及科学在内的19个垂直领域均展现出更高的准确度和流畅性,专业性、语言规范及风格表达均有所提升。
网易有道相关负责人强调,尽管通用大模型在参数和计算能力上竞争激烈,但翻译的专业性不能仅凭参数堆叠实现。在通用大模型竞相扩张的同时,有道坚信垂直模型的未来价值,致力于通过专用应用解决专业场景中的痛点。
回顾网易有道的发展历程,从早期的统计机器翻译到神经机器翻译,再到如今的大模型技术,其翻译产品已拥有超过10亿用户。据Quest Mobile数据显示,网易有道词典月活跃用户数已突破1亿,自2019年以来连续六年稳居教育工具类应用榜首。这一系列成就不仅是对网易有道技术创新能力的肯定,也为未来翻译技术的发展奠定了坚实的基础。