新浪新闻探索大会丨彭绍亮：多模态大数据驱动下的开源AI大模型

2025-11-10 14:32:58 [ 中关村在线原创 ] 作者：新闻快讯

11月5日，由微博与新浪新闻联合主办的“新浪新闻·2025探索大会”在北京落幕。在大会主题分享环节，湖南大学二级教授、长江学者、国家超算长沙中心副主任彭绍亮进行了题为《多模态大数据驱动下的开源AI大模型》的演讲。

湖南大学二级教授、长江学者、国家超算长沙中心副主任彭绍亮-主题演讲

以下是演讲实录，内容经编辑略有删减：

今天主要向大家汇报我们在开源大模型方面所做的一系列工作。作为全国第三家国家级超算中心，以及湖南省科技部批准的唯一智算中心，我们全面拥抱国产开源大模型，其中以DeepSeek为代表，同时也涵盖了包括BAT及字节跳动在内的多家互联网企业。目前，我们正致力于推动“人工智能+”在各行各业的应用。

过去十年，大语言模型已取得显著成就，毋庸置疑。而未来十年，或许是人工智能在应用领域实现广泛落地的关键时期。我们在通用大模型领域与GPT-5仍存在差距，尤其在人力与资源投入上，我们与领先国家相比仍有较大距离，这是我们必须正视的现实。

然而，我们的机遇在于垂直领域的深度融合。今天我将分享一系列实际案例，这些均基于国家超算中心已落地的项目，涵盖文化、艺术、金融、医疗等多个行业。

我去年开通了微博，并在此公布我的邮箱，诚挚欢迎各界推荐博士人才，尤其是博士后研究人员。近年来，我们招募了大量非计算机专业的博士及博士后，例如生物医学、中医药等方向，甚至包括研究“AI+伦理”的博士生。这表明我们已经全面进入一个开放、开源、多模态大数据驱动的人工智能时代。

我本人在国防科技大学学习工作二十年，曾参与研发全球知名的“天河”超级计算机系统。如今，新一代超级计算机正积极适应人工智能时代的需求，支持智能计算。此外，我还是国内较早从事大数据研究的长江学者之一。大数据概念引入中国已有十余年，我们在该领域持续深耕。

近年来，在人工智能领域，海外华人与国内研究人员形成了一定的竞争格局。斯坦福大学的相关报告将研究人员按地域与研究方向进行分类，自2023年至2025年，我均被归入人工智能与图像处理领域。我们积极推动大模型的开源开放，某种程度上这也反映了中美在人工智能领域的竞争态势。我们有不少学生在美国工作，但我们也努力吸引他们回国，共同致力于国产开源大模型的研发。

我们组织并参与了一系列国际期刊和国际会议，旨在增强中国在人工智能领域的话语权。过去十年，以Transformer为代表的技术虽有贡献，但仍存在局限。未来十年，我们期待在国际舞台上发出更多中国声音。

我们所列的国际期刊与会议多由华人学者牵头，同时在“人工智能+生物医药”应用方面也取得了进展。

通用人工智能与多模态技术已成为当前热点。当我们还在专注于大语言模型时，行业已向多模态跃迁，整合多维世界数据；当我们探讨多模态时，AIoT（人工智能物联网）已悄然兴起。大模型驱动的无人机、无人车、无人艇，以及能够调用各类工具的智能体（Agent），正逐步模拟人类操作，实现多样化任务。约四五年前提出的AIoT，如今已进一步演进为具备自学习、自我反思与创新能力的系统，模仿人类的思维链、长程思考及创新能力，覆盖剧本创作、科学发现、文化艺术等多个领域。

2024年，人工智能领域成果显著，诺贝尔物理学奖和化学奖均授予AI专家。其中五位获奖者中有四位是我们的同行，我们曾有过多年的合作与交流。这促使我们反思：为何在AI研究蓬勃发展的背景下，原创性突破多由他人实现？我们是否能够在0到1的原创研究与1到10的应用拓展上取得更大进展？

目前，国内研究多集中于10到100的优化与推广，原创性方面仍是我们的短板。我们期待在基础研究领域实现更多中国原创贡献。值得关注的是，近年诺贝尔物理学奖与化学奖得主中不乏我们的紧密合作伙伴，我们在论文发表与学术会议方面保持长期协作。抛开政治因素，我们希望在技术上持续提升自身实力。

多模态数据涵盖语言、文字、音频、视频，甚至超越人类感知的高维向量与矩阵。人类通过感官所能感知的数据仅占自然界总量的约0.1%。人类通过发明望远镜、显微镜、测序仪等工具，探索感官无法直接获取的数据，然而这些数据总和仍不足物理世界信息量的10%。因此，我们期望利用大模型技术，实现对这类数据的采集、挖掘、分析乃至生成。大模型在处理高维向量与矩阵，尤其是维度在100至200之间时，展现出卓越能力，即所谓的“智能涌现”。我们正探究大模型在处理高维数据方面超越人脑的机制，并尝试将其应用于无人机、无人车、无人艇等智能体的自主学习。

多模态学习旨在整合不同模态的数据，进行联合学习、建模与推理。其能力超越单一模态，具备更深入的理解力。我们期望在多模态领域取得更大突破，使其不仅能处理人类感官可接收的数据，更能处理人类难以直接处理的信息，充分发挥机器的特长。

当前，我们致力于降低系统成本与功耗。作为超级计算机的研发与运营者，电费是我们最大的开支之一。我们正努力优化模型，例如借鉴DeepSeek的思路，推动低成本、低功耗的解决方案，以实现更环保、更绿色的计算。

在生物医学领域，我们开展了多中心研究，旨在提升大模型的泛化能力与鲁棒性，并强化其临床实际应用效果。我们希望国产大模型在处理多样化语料时也能达到国际水平。尽管DeepSeek在国内广受欢迎，但需指出的是，由于训练数据以中文为主，国产大模型在能力上与GPT-5仍有明显差距。国内通用大模型正在奋力追赶，但同行们都清楚其中的挑战。

我们聚焦于生物医药等垂直领域，研发了一系列开源国产大模型，覆盖从DNA、RNA序列到分子结构、蛋白质、单细胞、电子病历、医学影像及人群队列等生命科学数据。我们构建了多个应用平台，包括调控因子识别、药物反应预测、新药研发、肿瘤预测与诊疗方案生成等。这些成果均由我们团队主导，并坚持开源策略，以引领全球开源潮流。例如，我们研发了全球首个药物大模型“神农GPT”，以及蛋白质语言大模型等。我们的开源举措也推动了国际同行的跟进。在蛋白质与DNA结合领域，我们仅用三个月便完成模型开发并开源，相关成果发表于《Nature》子刊。

2023年9月，国家自然科学基金委员会对我们团队的工作进行了报道。我们应是全球首个在该领域开源DNA蛋白质绑定模型的团队。我们还开发了“药诊大模型”，辅助医生开药与患者服药。全国多家三甲医院药剂科已投入使用该系统。初期我们免费提供使用，以收集反馈并持续优化。

我们正构建全球最大的用药数据库，目前已汇集海量处方数据，包括不良处方与不良反应的快速排查。我们提出“时辰药理学”概念，根据患者作息时间，个性化推荐用药时间，以优化药物在体内的代谢过程。这一切均基于我们的大模型“神农GPT”，并坚持开源策略，邀请全球用户测试并提供反馈。我们已迭代多个版本，2023年国家基金委亦对此进行了报道。

我们最新的研究工作已投稿，正与多家医院合作，涵盖内科、影像科、放射科等科室。针对中国高发的肺癌、结直肠癌等疾病，我们整合CT、木板、MRA等多模态数据，输入大模型进行处理。模型展现出卓越能力，医生与人工智能系统分别从主观与客观角度对模型进行评估，结果显示效果显著。

无论在模型鲁棒性、诊疗精度还是随访能力方面，表现均非常出色。目前已在30多个科室应用，水平超过副主任医师，并正扩展至更多科室。医生们对辅助诊疗系统反馈积极。

超级计算与大模型的发展离不开算力支持。升级后，我们的AI算力达1000P，双精度浮点计算能力为200P。作为全国第三家国家级超算中心及湖南省唯一国家级智算中心，我们持续升级算力、网络与存储能力，旨在为广大企业、高校师生提供全面服务，共同打造国产平台。

2024年12月31日，我们在湖南省率先部署并调通DeepSeek，推出“长沙DeepSeek”。初期供湖南大学师生使用，随后推广至全社会。春节期间，公众对国产开源大模型的出现反响热烈。然而，也需指出，该模型目前存在幻觉问题，面临一定挑战。

2025年2月13日，我们将DeepSeek接入胸外科无管化手术平台，用于临床路径规划，效果显著。至3月7日，整个肿瘤医院所有科室均接入系统，在处方、复诊与随访等方面展现出强大能力，获得医护人员好评。尽管DeepSeek目前存在幻觉问题，但其成功应用仍具有里程碑意义。

2月14日，我们发布湖南省首个垂直领域DeepSeek模型——“CS-DeepSeek”，面向数字政府、数据要素运营及国资国企服务，提升办公、办会、办文效率。发布当日，中国移动及合肥等城市亦推出类似模型，引发广泛关注。智慧安防、智慧医疗、智慧交通等领域竞争日趋激烈。

3月13日，我们发布基础教育大模型，实现“教学评管严、德智体美劳”全面覆盖，辅助教师命题、出卷、批改作业，一秒内完成作业批改，提升学生学习效率与纠错能力，助力学校管理增效。该模型为国际国内首个基础教育领域大模型，旨在减轻学生负担，提升学习兴趣，缓解教师压力。湖南四大名校之一长郡中学的校领导及教育局官员均出席发布活动。

发布后，模型迭代迅速，至六七月已覆盖学校各方面需求，如AI教案与课件制作、知识点打通、学情诊断、作业管理、智能批改等。系统通过手机端实现无缝连接，深受师生欢迎。平台还能记录学生成长轨迹，发挥个性特长，关注德智体美劳全面发展，并通过隐私保护方式，提供心理健康监测与干预服务。

我们还与金融公司合作，研发七个金融大模型，助力个性化理财与投资。该上市公司未来三年将投入超过两亿元支持此项工作。

长沙市政府与湖南省网站已全面接入大模型，不仅限于DeepSeek，还包括其他国产模型，以提升办公效率。

在艺术领域，我们推出艺术大模型，整合文化艺术的学业、就业、创业、消费、社交、灵感与设计等多维度需求。平台汇聚知名编导、导演、演员、舞蹈教师、绘画大师及其学生，实现艺术领域多模态数据融合。无论是消费者还是从业者，均可在平台上找到相应资源与服务。该模型还可对创作作品进行确权、发布与评级，助力艺术家推广与交易。模型于7月18日在超算中心发布，暑期期间正式投入使用。

最后，谈谈我们与国际领先水平的差距。主要挑战在于国际竞争激烈，尤其是来自美国的压力。对方于2月27日发布的4.5版本在写作与编程方面表现卓越，幻觉率极低，但价格昂贵。5.0版本虽解决部分问题并实行免费策略，却不向中国开放。其编程能力与低幻觉率使其在通用大模型领域一骑绝尘。我们评估其水平约相当于硕士一二年级，尚未达到博士专家级别。该模型采用统一架构，具备路由机制、持久记忆等创新功能，展现出全面优势。我们正深入分析其技术特点，思考如何在多模态能力、通用路由、验证机制及实时学习等方面实现突破。

我还撰写了一本科普书籍，用时一小时向中学生阐释为何我们已进入可创作、可书写、可拥有的Web 3.0时代。该书入选中国三大畅销书榜，我们一如既往地开源相关代码、数据集与PPT课件。我所著的专著也欢迎关注，我们期望通过这些工作传递中国声音。该成果荣获教育部大数据类一等奖，所有平台与数据均对外开放，供教师教学与学生学习使用。

我们创立了全球首个数字孪生元宇宙国际期刊，并设立专业委员会。2020年创刊后，在欧美注册虽遇阻，但仍坚持国际化运作，现已有欧美出版社提出收购意向。

因时间有限，不再赘述。我们在通用领域虽存差距，但在垂直领域机遇显著。我们将持续努力，从硬件芯片、操作系统到应用软件，充分发挥中国在工程落地方面的优势，推动整个领域进步。

我们开发的“湖湘文化大模型”，整合了岳麓书院学规、日志等本土文化资源，包含超过十万册古籍、地方志、《湘江评论》、湖南花鼓戏、马王堆图像等数据，构建红色基因知识图谱，涵盖从曾国藩、王夫之到毛泽东等近现代人物，支持文物文旅宣传方案生成。该模型与社科院合作研发，已在岳麓书院部署，全面利用多模态数据进行学习与生成。

总体而言，未来发展空间广阔。Scaling Law仍然适用，随着数据与计算资源的持续投入，大模型能力不断提升，尚未见顶。竞争仍在持续，据专家预测，未来十年该领域仍将保持发展势头。

我们期望走出一条具有中国特色的发展路径，提出“能力密度法则”，避免如美国般巨额投入，转而寻求环保、绿色的发展模式。即便性能暂未超越，但力求实用，或以较小代价在短期内推出国产大模型。多家互联网公司正与我们合作，共同投入研发。

最后，诚挚欢迎各界与国家超算长沙中心深度合作，共同打造国产超算与智算融合的开源大模型。未来十年是“AI+”的黄金时代，垂直应用领域需求旺盛。我们的核心目标是全面缩短工作与学习时间，提升效率，秉持科技向善、人工智能向善的理念，解放人类生产力，让大众有更多时间独立思考、陪伴家人、享受学习与生活。

谢谢！

本文属于原创文章，如若转载，请注明来源：新浪新闻探索大会丨彭绍亮：多模态大数据驱动下的开源AI大模型https://news.zol.com.cn/1079/10795054.html