长本文、长图文加长语音，国产大模型的内卷新方向？

2024-04-26 14:31:36 [ 中关村在线原创 ] 作者：科技快讯

4月26日，科大讯飞V3.5发布更新版本，宣布讯飞星火成为业界首个支持长文本、长图文以及长语音的大模型产品。

作为人工智能国家队，科大讯飞此次升级的讯飞星火V3.5，面向用户高效准确知识获取的痛点，不同于行业单“卷”长文本，科大讯飞还为大模型加入了长图文、长语音功能，拓宽了大模型多媒体资料获取和理解的能力。

科大讯飞能为已经稍显降温的长文本注入新的活力吗？长图文和长语音的加入，能打开大模型打开更大的想象空间吗？

用户高效知识获取痛点在哪里？

长文本已经成为国产大模型比拼的新方向。在经过长达一年的对标 ChatGPT-4、比拼参数大小的同质化竞争之后，中国人工智能公司们终于找出了一个更容易被普通用户理解、也更能直观地超越美国同行们的差异化标的。

掀起这一波竞争浪潮的是国内大模型创业公司月之暗面。这家公司在去年将旗下的大模型 Kimi 的上下文参数规模提升至 20 万字，上个月又提升至 200 万，迅速引爆市场。3 月，阿里旗下的通义千问已经将这一数字更新到 1000 万，宣称是“全球文档处理容量第一的 AI 应用”。

华泰证券在一份研报中指出，具有长上下文的大模型通用性更强，用户将特定领域的知识通过上下文的方式输入到模型中，模型即可通过上下文学习掌握相应内容，一定程度上代替模型的微调。

但经过几个月的比拼跟进之后，长文本之于大模型似乎又成了一项厂家炫技的同质化环节，以至于有媒体已经飞快地喊出了“长文本降温”的口号，长文本如何才能真正落地陷入瓶颈。

大模型长文本功能的落地需要重点解决两个问题。一是海量文本的高效处理。面对上百万甚至上千万文字，模型后台消耗的运算资源也成倍增加，业界的一些大模型往往智能处理前 20% 或前 50% 的内容，之后的处理效率就大大减慢。

二是如何保证大模型在科研、医疗、法律等行业专业场景的准确率，这样才能解决大模型在刚需场景的应用问题。

科大讯飞董事长刘庆峰介绍，为了解决大模型应用效率和准确率问题，讯飞星火 V3.5 提升了对长文本的理解、学习、回答能力，并进行了重要的模型剪枝和蒸馏，从而推出业界最优的 130 亿参数的大模型。在效果损失仅 3% 以内的情况下，使得星火在文档上传解析、知识问答的首响时间以及文字生成效率方面都获得了极大的效率提升。

在对比测试中，使用讯飞星火对比国内可测最好的大模型，在保障长文本效果的情况下，无论是10K、64K、128K token，还是更长的文本上，星火大模型的性能都是业界最优。

在准确率上，本次讯飞星火长文本功能全新升级后，具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力，总体已经达到GPT-4 Turbo 4月最新长文本版本的97%水平，而在银行、保险、汽车、电力等多个垂直领域的知识问答任务上，讯飞星火长文本总体水平已经超过GPT-4 Turbo。