1月30日,科大讯飞正式发布了首个基于全国产化算力平台“飞星一号”的开源大模型——星火开源-13B。目前,华为昇思开源社区已上架了这款大模型的开源版-13B,并且提供给学术研究和企业研究者完全免费使用。
本次开源的大模型包含130亿稠密参数,包括基础模型iFlytekSpark-13B-base、精调模型iFlytekSpark-13B-chat,还提供了微调工具iFlytekSpark-13B-Lora和人设定制工具iFlytekSpark-13B-Charater。研究者可以利用全栈自主可控的星火优化套件更便利地训练自己的专用大模型。
值得一提的是,这款大模型基于“飞星一号”训练而成,全栈国产适配优化,简单易用,场景应用效果领先。该训练策略针对昇腾算力极致优化,训练效率达到了A100的90%。科大讯飞表示,这不仅是对昇腾AI硬件的进一步深度优化,也展示了国产算力在追赶国际先进水平方面的决心和能力。
本文属于原创文章,如若转载,请注明来源:星火开源-13B发布:首个基于全国产化算力平台”飞星一号”的开源大模型https://news.zol.com.cn/854/8542612.html