“算力使能,开放无限”,2023开放数据中心峰会以此为主题,在北京国际会议中心成功举办。
在大模型时代的服务器技术创新分论坛上,华为昇腾互联网首席解决方案架构师安宝磊发表主题演讲,对AI大模型发展趋势及应用方向,华为昇腾加速大模型研发和落地的技术优势与生态发展进行了全面的解读。
从专用到通用人工智能进入大模型时代
2022年11月,人工智能模型ChatGPT的发布,掀起了AI热潮,也推动AI发展跨越拐点,从“预测推断”走向“内容生成”。此前的AI技术发展,更多的处于专用领域,即感知理解
当人工智能进入大模型时代,随着AI大模型技术快速成熟,AI算法与应用的开发、上线部署与业务发放等过程均大幅简化,使用门槛大幅降低。在专用领域场景专属化阶段,可称之为小模型时代,而随着越来越多的场景通用化,一套AI系统可以使能全业务流创新,则预示着大模型时代的到来。安宝磊表示,随着大模型重塑产业格局,未来两年将落地50%+行业的核心场景。现阶段所面临的问题,在于2C应用用户商业付费挑战较大,2B应用在行业数据积累、模型调测和行业应用集成等方面,均需要时间积累。
从挑战到创新昇腾大模型+AI集群构筑坚实底座
大模型不仅需要算法,而且需要数据处理,软硬件优化、模型开发、应用创新的系统工程能力,作为复杂系统工程,大模型的每个环节都存在着大量工程技术挑战,其中最主要的三个关键挑战在于:一是如何生成高质量的数据和高质量的模型,在模型选型、架构调整设计、技术验证过程设计方面非常复杂,试错成本高;二是如何完成大规模训练和调优工程,大模型训练对于集群稳定性有很高的要求,如果算力平台不稳定,训练任务频繁中断,训练成果有很大损失;三是如何实现
为解决以上挑战,华为联合伙伴推出了昇腾大模型解决方案,使能全流程开发与应用创新。从数据、模型准备到算力准备、模型训练,再到模型部署和集成,解决方案均可满足,不仅适用于多种场景,而且应对全行业客户需求,应用了昇腾AI基础软硬件能力、伙伴模型以及平台优势,结合生态伙伴彼此在大模型训练、微调和优化方面的算法和模型能力,添加了大模型推理引擎、调优工具和算子加速库。方案的优势在于10倍集群稳定性、20倍大模型无损压缩、自动生成和标注指令数据,以及
大模型需要大算力,华为昇腾AI集群为大模型创新应用构筑坚实底座。从Atlas900 PoD到Atlas900 A2PoD,通过产品的不断更新持续迭代升级,华为可提供业界领先的人工智能大规模集群。通过可诊断、可衡量、可恢复的多级可靠机制,可提供10倍级提升集群系统稳定性。其中,无感知断点续训,可实现千亿参数模型30分钟无感恢复训练,从仿真验证到故障检测+诊断+预测,全面保障硬件稳定可靠。与此同时,方案通过软硬件原生协同设计,还可实现系统级优化AI集群,加速大模型训练开发。
从深度开放到全面兼容华为加速昇腾AI产业生态繁荣发展
在大模型时代,开放的生态也非常重要。昇腾AI深度开放,全面支持业界各类框架、加速库及三方社区生态,并提供全流程迁移工具,可快速实现大模型和应用的适配,目前已支持ChatGLM、LLaMA2、GPT、BLOOM等数十个业界主流大模型。同时,基于昇腾AI也原生孵化了业界
在行业应用领域,昇腾在大模型的行业落地方向探索最早,在生物医药、教育、遥感、电力和互联网等多个行业场景实现了多个大模型的应用落地。国内的互联网公司已经在推荐广告,搜索,内容审核等核心业务场景越来越多的使用昇腾产品方案,满足互联网公司对AI算力快速增长需求的同时助力互联网行业打造创新应用,提升业务竞争力。在基础大模型方面,昇腾孵化的基础大模型涵盖了多个技术领域,对各个技术方向下的大模型孵化均有积累。在大模型产业落地上,昇腾AI联合产业链上下游伙伴,推动大模型技术加速落地,目前已成立多模态人工智能产业联合体、智能遥感开源生态联合体和智能流体力学产业联合体,未来还计划在智慧育种、AI生物制药等领域牵引成立联合体,促进大模型产业聚合发展。
伴随大模型带来的生成式AI突破,人工智能正进入一个新时代。如今,昇腾AI产业正在蓬勃发展中,华为携手多家合作伙伴在互联网、金融、运营商等多领域打造2500多个AI解决方案,提供软硬件支持,开放AI模组、加速卡,推出形式多样的接口开发文档和参考设计,助推市场创新活动稳步提升。面向未来,华为将通过系统级创新、坚持开源开放、深耕行业,加速昇腾人工智能产业生态繁荣发展,持续提升AI赋能,与伙伴联合创新推进人工智能走深向实,助力人工智能与各行各业深度融合,用强大的算力支撑人工智能高质量的发展,为行业智能升级提供新动能。
“数智