
6月23日,网易有道宣布正式开源“子曰3”系列大模型的数学模型(英文名称Confucius3-Math)。这是国内首个专注于数学教育,可在单块消费级GPU上高效运行的开源推理模型。其在一系列数学推理任务中取得当前最优性能,超越了许多规模更大的通用模型。该模型的开源,为教育领域提供了低成本、高性能的AI解决方案,推动大模型技术向教育领域加速渗透。
低成本高性能,助力教育公平
据悉,“子曰3数学模型”在解决国内数学问题任务中展现出了显著优势。其通过大规模增强学习以及一系列的创新算法,训练成本仅为2.6万美元,推理性能约为DeepSeek R1的15倍。
测试数据显示,在CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等数据集上,14B轻量级的“子曰3数学模型”各项得分均高于DeepSeek-R1等通用大模型。在GAOKAO-Bench(Math)这一基于高考数学题的大模型评测框架中,“子曰3数学模型”的得分高达98.5分。
除了出色的性能,“子曰3数学模型”的成本优势同样显著,其在消费级GPU即可运行,大大降低了教育场景的AI应用门槛。
事实上,中小学教育长期面临教育资源不平等、个性化辅导资源不足、复杂题型讲解成本高等痛点,而教育大模型能有效辅助提升学习效果,但高性能大模型的构建和部署成本却非常高昂,许多低收入地区难以负担。
针对这一问题,“子曰3数学模型”实现了部署性能的极致突破,服务成本每百万token低至0.15美元,远超目前大多数通用大模型的成本效益。这意味着更广泛的普通教育机构和开发者都能以低成本部署专业级的数学AI应用。
“对于行业而言,‘子曰3数学模型’证明了在低成本情况下,在特定领域构建强大推理模型的可行性,为垂类推理大模型的研发与应用提供了重要参考。”网易有道首席科学家段亦涛表示。
“AI+教育”加速进化,子曰释放教育大模型应用价值
自2023年7月推出国内首个教育大模型“子曰”以来,网易有道在“AI+教育”领域加速进化,持续释放大模型在教育行业的应用价值。
从“子曰”大模型在一年内快速推出10余个垂直应用,到今年初发布国内首个输出分步式讲解的推理模型“子曰-o1”,再到如今“子曰3数学模型”正式开源,网易有道充分结合应用场景进行模型迭代和优化,持续推动教育大模型技术创新和应用落地。
此次“子曰3数学模型”发布及开源,标志着“子曰”大模型系列在轻量级模型推理能力上实现了又一重要突破,也使得有道在教育大模型领域长期积累的技术成果能够共享给更多的开发者和从业者,构建起协同发展的行业格局。
段亦涛强调:“AI+教育的终极目标不是替代教师,而是让技术成为教育公平的杠杆。希望‘子曰3数学模型’的开源能够吸引更多开发者加入,共同探索推理模型在教育领域的应用价值。”
本文属于原创文章,如若转载,请注明来源:有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型https://news.zol.com.cn/1002/10023185.html