
当业界还在热议DeepSeek-R1开源战略对AI生态的重构、持续探讨Manus智能Agent的技术突破时,国产大模型已在垂直赛道实现关键性跨越。3月11日,网易有道宣布完成翻译底层技术迭代,基于自主研发的子曰翻译大模型2.0,在测试中实现翻译质量超越国内外主流通用大模型,达行业第一。此次突破,也标志着国产大模型在专业领域取得实质性进展,通过数据、算法等技术创新,使得小参数垂类模型实现性能大幅提升。
据了解,搭载全新大模型的翻译已在有道词典、有道翻译及有道翻译官内上线,提供标准模型、高级模型两种不同参数选择,用户可免费使用全新AI翻译,体验更精准、优质的翻译服务。与此同时,有道词典笔X7系列也已升级为最新的翻译大模型,其余型号将陆续更新。
【有道翻译首页】
作为国内翻译领域的领先者,有道全系翻译产品目前拥有超10亿用户。QuestMobile数据显示,从2019年至今,网易有道词典已连续六年荣获「中国互联网APP TOP50赛道用户规模NO.1」,持续占据教育工具领域榜首。
继率先推出统计机器翻译及神经网络翻译(NMT)后,有道再次领衔行业,在翻译技术上实现重大突破,使子曰翻译大模型2.0的整体性能实现质的飞跃。
根据国际权威翻译评测集WMT和Flores200的最新测试数据显示,子曰翻译大模型2.0在中英互译领域的译文专业度和稳定性较前代版本均有显著提升。除此之外,在涵盖人文学科、商科、生活服务、医疗、科学等19个垂直领域的多学科对比测试中,子曰翻译大模型2.0与国内外主流通用大模型及专业翻译模型展开“全面竞技”,数据显示,子曰翻译大模型2.0在专业性、准确性、语言惯例和风格等方面,展现出了更高的翻译准确率、流畅度,模型翻译质量达到行业第一。
经历了10个月的技术更迭,子曰翻译大模型2.0从数据、算法、评估三个层面进行技术突破,最终以14B小参数垂类模型实现高水准翻译性能,这也再次展现出有道在教育大模型发展上的垂直专业优势。
在数据层面,有道收集并严格清洗了高质量的翻译语料数据,并由英语专八认证人员及职业译员进行精细化人工标注,使得模型拥有海量的优质数据资源库,增强其在多样化翻译场景的应对能力。
在算法层面,有道以子曰大模型为基础,进行二次预训练,进一步打造了更具专业性与针对性的翻译基座大模型,结合大模型蒸馏技术、大模型融合技术、Online DPO技术等多项手段,有效避免了大模型的灾难性遗忘问题,并在运行效率、准确性、流畅性等翻译性能上实现了大幅提升。
在评估层面,借助翻译数据沉淀,有道自主研发了翻译评估模型Reward Model,其准确率超越了COMET——当前最先进的评估指标之一,为子曰翻译大模型的性能评估提供可靠的量化依据及完善的人工评估方案,多维度对模型的翻译结果进行评估和分析。
事实上,随着DeepSeek等开源模型的应用范围逐渐扩大,“场景+数据”越来越成为AI应用的护城河。作为深耕翻译领域17年的代表,有道在该领域内的数据及资源积累,使其能够以高质量语料训练强化模型的翻译性能,展现出更强的领域专业性和翻译任务针对性,使得小参数垂类模型的翻译质量反超通用大模型。
“通用大模型比的是参数大、算力强,但翻译这件事,参数堆不出专业度;当通用大模型竞逐参数规模时,我们还是更相信垂类模型的未来价值——用专业的垂直应用真正解决专业场景的痛点,这也正是我们持续努力和进化的方向。”网易有道相关负责人表示。
本文属于原创文章,如若转载,请注明来源:有道大模型翻译技术再突破,小参数垂类模型实现翻译质量全球第一https://news.zol.com.cn/958/9587790.html