热点：

阿里通义发布320亿参数QwQ-32B大模型性能比肩国际领先水平

2025-03-06 07:40:50 [ 中关村在线原创 ] 作者：散落的星星沙

阿里通义发布320亿参数QwQ-32B大模型性能比肩国际领先水平

3月6日消息，阿里巴巴通义千问团队正式发布了其最新研究成果——QwQ-32B大语言模型。该模型拥有320亿参数规模，尽管参数量远小于某些大型模型，但其性能却能够与参数量高达6710亿（其中370亿参数被激活）的国际领先模型DeepSeek-R1相媲美。

通过强化学习技术，QwQ-32B在参数量仅为DeepSeek-R1约1/21的情况下，实现了性能上的显著提升。此外，阿里巴巴还为这一推理模型集成了与Agent相关的能力，使其不仅能够在使用工具时进行批判性思考，还能根据外部环境反馈动态调整推理过程。

QwQ-32B在多项基准测试中展现了卓越的表现，涵盖数学推理、编程能力及通用能力等多个领域。在评估数学能力的AIME24评测集以及测试代码生成能力的LiveCodeBench评测中，QwQ-32B的表现与DeepSeek-R1相当，并且大幅优于o1-mini及参数规模相同的R1蒸馏模型。

不仅如此，在多个权威评测榜单上，QwQ-32B同样取得了优异成绩。例如，在由Meta首席科学家领衔开发的“最具挑战性LLMs评测榜”LiveBench、谷歌提出的指令遵循能力评估体系IFEval，以及加州大学伯克利分校设计的函数或工具调用准确性评估测试BFCL中，QwQ-32B的得分均超越了DeepSeek-R1。

目前，QwQ-32B已经在国际知名开源平台以及阿里巴巴旗下的ModelScope上对外开源，用户也可以通过Qwen Chat直接体验这一模型的功能。

本文属于原创文章，如若转载，请注明来源：阿里通义发布320亿参数QwQ-32B大模型性能比肩国际领先水平https://news.zol.com.cn/956/9565601.html

猜你喜欢
最新
精选
相关

手机版阅读即时更新

点击加载更多内容

中关村在线首页新闻中心首页

热门搜索

苹果发布会 AWE 台北电脑展 mwc

热词：智能穿戴汽车科技三菱空调

24小时热文
本周热评

推荐问答

提问

论坛精选
最热回答

摄影
手机
硬件
笔电
平板

0

下载ZOL APP
秒看最新热品

内容纠错