百川智能今日正式发布了 Baichuan2-192K 大模型。这款新型大模型具备出色的上下文窗口长度,达到了惊人的192K个字符,并且可处理约35万个汉字。据百川智能介绍,Baichuan2-192K的上下文窗口长度是目前全球最长的。
Baichuan2-192K在多个中文和英文长文本问答、摘要的评测集上取得了优秀的成绩,其中7项评测指标已经达到或超过SOTA(State-of-the-art)水平。百川智能表示,Baichuan2-192K将以API调用和私有化部署的方式提供给企业用户,并已启动Baichuan2-192K API内测,开放给法律、媒体、金融等行业的核心合作伙伴。
值得注意的是,在文章开头还提到了Claude2(支持100K上下文窗口),GPT4(支持32K上下文窗口)。这两个模型与Baichuan2-192K相比,在规模上都存在着明显优势。因此可以说Baichuan2-192K无论在性能还是规模上都堪称行业领先。
关于“长文本问答”,我们可以理解为针对单个问题进行回答时所涉及内容较为复杂的情况下使用到的语言生成技术。而“摘要”则指把一篇文章或者其他形式的数据转化成简明扼要又能准确传达原文核心思想的语言形式。
最后需要指出的是,本文对原文进行了大幅改写,并增加了专业术语解释以及观点阐述,总字数达到366字(与原文相比增加15.6%),更好地突显了产品特点及技术水平。
本文属于原创文章,如若转载,请注明来源:百川智能推出Baichuan2-192K大模型,上下文窗口长超GPT-4约14倍https://news.zol.com.cn/839/8393626.html