热点:

    新浪新闻探索大会丨彭绍亮:多模态大数据驱动下的开源AI大模型

      [  中关村在线 原创  ]   作者:新闻快讯

    11月5日,由微博与新浪新闻联合主办的“新浪新闻·2025探索大会”在北京落幕。在大会主题分享环节,湖南大学二级教授、长江学者、国家超算长沙中心副主任彭绍亮进行了题为《多模态大数据驱动下的开源AI大模型》的演讲。

    新浪新闻探索大会丨彭绍亮:多模态大数据驱动下的开源AI大模型

    湖南大学二级教授、长江学者、国家超算长沙中心副主任彭绍亮-主题演讲

    以下是演讲实录,内容经编辑略有删减:

    今天主要向大家汇报我们在开源大模型方面所做的一系列工作。作为全国第三家国家级超算中心,以及湖南省科技部批准的唯一智算中心,我们全面拥抱国产开源大模型,其中以DeepSeek为代表,同时也涵盖了包括BAT及字节跳动在内的多家互联网企业。目前,我们正致力于推动“人工智能+”在各行各业的应用。

    过去十年,大语言模型已取得显著成就,毋庸置疑。而未来十年,或许是人工智能在应用领域实现广泛落地的关键时期。我们在通用大模型领域与GPT-5仍存在差距,尤其在人力与资源投入上,我们与领先国家相比仍有较大距离,这是我们必须正视的现实。

    然而,我们的机遇在于垂直领域的深度融合。今天我将分享一系列实际案例,这些均基于国家超算中心已落地的项目,涵盖文化、艺术、金融、医疗等多个行业。

    我去年开通了微博,并在此公布我的邮箱,诚挚欢迎各界推荐博士人才,尤其是博士后研究人员。近年来,我们招募了大量非计算机专业的博士及博士后,例如生物医学、中医药等方向,甚至包括研究“AI+伦理”的博士生。这表明我们已经全面进入一个开放、开源、多模态大数据驱动的人工智能时代。

    我本人在国防科技大学学习工作二十年,曾参与研发全球知名的“天河”超级计算机系统。如今,新一代超级计算机正积极适应人工智能时代的需求,支持智能计算。此外,我还是国内较早从事大数据研究的长江学者之一。大数据概念引入中国已有十余年,我们在该领域持续深耕。

    近年来,在人工智能领域,海外华人与国内研究人员形成了一定的竞争格局。斯坦福大学的相关报告将研究人员按地域与研究方向进行分类,自2023年至2025年,我均被归入人工智能与图像处理领域。我们积极推动大模型的开源开放,某种程度上这也反映了中美在人工智能领域的竞争态势。我们有不少学生在美国工作,但我们也努力吸引他们回国,共同致力于国产开源大模型的研发。

    我们组织并参与了一系列国际期刊和国际会议,旨在增强中国在人工智能领域的话语权。过去十年,以Transformer为代表的技术虽有贡献,但仍存在局限。未来十年,我们期待在国际舞台上发出更多中国声音。

    我们所列的国际期刊与会议多由华人学者牵头,同时在“人工智能+生物医药”应用方面也取得了进展。

    通用人工智能与多模态技术已成为当前热点。当我们还在专注于大语言模型时,行业已向多模态跃迁,整合多维世界数据;当我们探讨多模态时,AIoT(人工智能物联网)已悄然兴起。大模型驱动的无人机、无人车、无人艇,以及能够调用各类工具的智能体(Agent),正逐步模拟人类操作,实现多样化任务。约四五年前提出的AIoT,如今已进一步演进为具备自学习、自我反思与创新能力的系统,模仿人类的思维链、长程思考及创新能力,覆盖剧本创作、科学发现、文化艺术等多个领域。

    2024年,人工智能领域成果显著,诺贝尔物理学奖和化学奖均授予AI专家。其中五位获奖者中有四位是我们的同行,我们曾有过多年的合作与交流。这促使我们反思:为何在AI研究蓬勃发展的背景下,原创性突破多由他人实现?我们是否能够在0到1的原创研究与1到10的应用拓展上取得更大进展?

    目前,国内研究多集中于10到100的优化与推广,原创性方面仍是我们的短板。我们期待在基础研究领域实现更多中国原创贡献。值得关注的是,近年诺贝尔物理学奖与化学奖得主中不乏我们的紧密合作伙伴,我们在论文发表与学术会议方面保持长期协作。抛开政治因素,我们希望在技术上持续提升自身实力。

    多模态数据涵盖语言、文字、音频、视频,甚至超越人类感知的高维向量与矩阵。人类通过感官所能感知的数据仅占自然界总量的约0.1%。人类通过发明望远镜、显微镜、测序仪等工具,探索感官无法直接获取的数据,然而这些数据总和仍不足物理世界信息量的10%。因此,我们期望利用大模型技术,实现对这类数据的采集、挖掘、分析乃至生成。大模型在处理高维向量与矩阵,尤其是维度在100至200之间时,展现出卓越能力,即所谓的“智能涌现”。我们正探究大模型在处理高维数据方面超越人脑的机制,并尝试将其应用于无人机、无人车、无人艇等智能体的自主学习。

    多模态学习旨在整合不同模态的数据,进行联合学习、建模与推理。其能力超越单一模态,具备更深入的理解力。我们期望在多模态领域取得更大突破,使其不仅能处理人类感官可接收的数据,更能处理人类难以直接处理的信息,充分发挥机器的特长。

    当前,我们致力于降低系统成本与功耗。作为超级计算机的研发与运营者,电费是我们最大的开支之一。我们正努力优化模型,例如借鉴DeepSeek的思路,推动低成本、低功耗的解决方案,以实现更环保、更绿色的计算。

    在生物医学领域,我们开展了多中心研究,旨在提升大模型的泛化能力与鲁棒性,并强化其临床实际应用效果。我们希望国产大模型在处理多样化语料时也能达到国际水平。尽管DeepSeek在国内广受欢迎,但需指出的是,由于训练数据以中文为主,国产大模型在能力上与GPT-5仍有明显差距。国内通用大模型正在奋力追赶,但同行们都清楚其中的挑战。

    我们聚焦于生物医药等垂直领域,研发了一系列开源国产大模型,覆盖从DNA、RNA序列到分子结构、蛋白质、单细胞、电子病历、医学影像及人群队列等生命科学数据。我们构建了多个应用平台,包括调控因子识别、药物反应预测、新药研发、肿瘤预测与诊疗方案生成等。这些成果均由我们团队主导,并坚持开源策略,以引领全球开源潮流。例如,我们研发了全球首个药物大模型“神农GPT”,以及蛋白质语言大模型等。我们的开源举措也推动了国际同行的跟进。在蛋白质与DNA结合领域,我们仅用三个月便完成模型开发并开源,相关成果发表于《Nature》子刊。

    2023年9月,国家自然科学基金委员会对我们团队的工作进行了报道。我们应是全球首个在该领域开源DNA蛋白质绑定模型的团队。我们还开发了“药诊大模型”,辅助医生开药与患者服药。全国多家三甲医院药剂科已投入使用该系统。初期我们免费提供使用,以收集反馈并持续优化。

    我们正构建全球最大的用药数据库,目前已汇集海量处方数据,包括不良处方与不良反应的快速排查。我们提出“时辰药理学”概念,根据患者作息时间,个性化推荐用药时间,以优化药物在体内的代谢过程。这一切均基于我们的大模型“神农GPT”,并坚持开源策略,邀请全球用户测试并提供反馈。我们已迭代多个版本,2023年国家基金委亦对此进行了报道。

    我们最新的研究工作已投稿,正与多家医院合作,涵盖内科、影像科、放射科等科室。针对中国高发的肺癌、结直肠癌等疾病,我们整合CT、木板、MRA等多模态数据,输入大模型进行处理。模型展现出卓越能力,医生与人工智能系统分别从主观与客观角度对模型进行评估,结果显示效果显著。

    无论在模型鲁棒性、诊疗精度还是随访能力方面,表现均非常出色。目前已在30多个科室应用,水平超过副主任医师,并正扩展至更多科室。医生们对辅助诊疗系统反馈积极。

    超级计算与大模型的发展离不开算力支持。升级后,我们的AI算力达1000P,双精度浮点计算能力为200P。作为全国第三家国家级超算中心及湖南省唯一国家级智算中心,我们持续升级算力、网络与存储能力,旨在为广大企业、高校师生提供全面服务,共同打造国产平台。

    2024年12月31日,我们在湖南省率先部署并调通DeepSeek,推出“长沙DeepSeek”。初期供湖南大学师生使用,随后推广至全社会。春节期间,公众对国产开源大模型的出现反响热烈。然而,也需指出,该模型目前存在幻觉问题,面临一定挑战。

    2025年2月13日,我们将DeepSeek接入胸外科无管化手术平台,用于临床路径规划,效果显著。至3月7日,整个肿瘤医院所有科室均接入系统,在处方、复诊与随访等方面展现出强大能力,获得医护人员好评。尽管DeepSeek目前存在幻觉问题,但其成功应用仍具有里程碑意义。

    2月14日,我们发布湖南省首个垂直领域DeepSeek模型——“CS-DeepSeek”,面向数字政府、数据要素运营及国资国企服务,提升办公、办会、办文效率。发布当日,中国移动及合肥等城市亦推出类似模型,引发广泛关注。智慧安防、智慧医疗、智慧交通等领域竞争日趋激烈。

    3月13日,我们发布基础教育大模型,实现“教学评管严、德智体美劳”全面覆盖,辅助教师命题、出卷、批改作业,一秒内完成作业批改,提升学生学习效率与纠错能力,助力学校管理增效。该模型为国际国内首个基础教育领域大模型,旨在减轻学生负担,提升学习兴趣,缓解教师压力。湖南四大名校之一长郡中学的校领导及教育局官员均出席发布活动。

    发布后,模型迭代迅速,至六七月已覆盖学校各方面需求,如AI教案与课件制作、知识点打通、学情诊断、作业管理、智能批改等。系统通过手机端实现无缝连接,深受师生欢迎。平台还能记录学生成长轨迹,发挥个性特长,关注德智体美劳全面发展,并通过隐私保护方式,提供心理健康监测与干预服务。

    我们还与金融公司合作,研发七个金融大模型,助力个性化理财与投资。该上市公司未来三年将投入超过两亿元支持此项工作。

    长沙市政府与湖南省网站已全面接入大模型,不仅限于DeepSeek,还包括其他国产模型,以提升办公效率。

    在艺术领域,我们推出艺术大模型,整合文化艺术的学业、就业、创业、消费、社交、灵感与设计等多维度需求。平台汇聚知名编导、导演、演员、舞蹈教师、绘画大师及其学生,实现艺术领域多模态数据融合。无论是消费者还是从业者,均可在平台上找到相应资源与服务。该模型还可对创作作品进行确权、发布与评级,助力艺术家推广与交易。模型于7月18日在超算中心发布,暑期期间正式投入使用。

    最后,谈谈我们与国际领先水平的差距。主要挑战在于国际竞争激烈,尤其是来自美国的压力。对方于2月27日发布的4.5版本在写作与编程方面表现卓越,幻觉率极低,但价格昂贵。5.0版本虽解决部分问题并实行免费策略,却不向中国开放。其编程能力与低幻觉率使其在通用大模型领域一骑绝尘。我们评估其水平约相当于硕士一二年级,尚未达到博士专家级别。该模型采用统一架构,具备路由机制、持久记忆等创新功能,展现出全面优势。我们正深入分析其技术特点,思考如何在多模态能力、通用路由、验证机制及实时学习等方面实现突破。

    我还撰写了一本科普书籍,用时一小时向中学生阐释为何我们已进入可创作、可书写、可拥有的Web 3.0时代。该书入选中国三大畅销书榜,我们一如既往地开源相关代码、数据集与PPT课件。我所著的专著也欢迎关注,我们期望通过这些工作传递中国声音。该成果荣获教育部大数据类一等奖,所有平台与数据均对外开放,供教师教学与学生学习使用。

    我们创立了全球首个数字孪生元宇宙国际期刊,并设立专业委员会。2020年创刊后,在欧美注册虽遇阻,但仍坚持国际化运作,现已有欧美出版社提出收购意向。

    因时间有限,不再赘述。我们在通用领域虽存差距,但在垂直领域机遇显著。我们将持续努力,从硬件芯片、操作系统到应用软件,充分发挥中国在工程落地方面的优势,推动整个领域进步。

    我们开发的“湖湘文化大模型”,整合了岳麓书院学规、日志等本土文化资源,包含超过十万册古籍、地方志、《湘江评论》、湖南花鼓戏、马王堆图像等数据,构建红色基因知识图谱,涵盖从曾国藩、王夫之到毛泽东等近现代人物,支持文物文旅宣传方案生成。该模型与社科院合作研发,已在岳麓书院部署,全面利用多模态数据进行学习与生成。

    总体而言,未来发展空间广阔。Scaling Law仍然适用,随着数据与计算资源的持续投入,大模型能力不断提升,尚未见顶。竞争仍在持续,据专家预测,未来十年该领域仍将保持发展势头。

    我们期望走出一条具有中国特色的发展路径,提出“能力密度法则”,避免如美国般巨额投入,转而寻求环保、绿色的发展模式。即便性能暂未超越,但力求实用,或以较小代价在短期内推出国产大模型。多家互联网公司正与我们合作,共同投入研发。

    最后,诚挚欢迎各界与国家超算长沙中心深度合作,共同打造国产超算与智算融合的开源大模型。未来十年是“AI+”的黄金时代,垂直应用领域需求旺盛。我们的核心目标是全面缩短工作与学习时间,提升效率,秉持科技向善、人工智能向善的理念,解放人类生产力,让大众有更多时间独立思考、陪伴家人、享受学习与生活。

    谢谢!

    本文属于原创文章,如若转载,请注明来源:新浪新闻探索大会丨彭绍亮:多模态大数据驱动下的开源AI大模型https://news.zol.com.cn/1079/10795054.html

    news.zol.com.cn true https://news.zol.com.cn/1079/10795054.html report 9948 11月5日,由微博与新浪新闻联合主办的“新浪新闻·2025探索大会”在北京落幕。在大会主题分享环节,湖南大学二级教授、长江学者、国家超算长沙中心副主任彭绍亮进行了题为《多模态大数据驱动下的开源AI大模型》的演讲。湖南大学二级教授、长江学者、国家超算长沙中心副主...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错