热点:

    小米自研声音识别算法能力再精进,音频标记任务中排名第一

      [  中关村在线 原创  ]   作者:海是天的倒影

    小米自研的声音识别算法在音频标记任务中取得重要突破。该算法以公开数据集AudioSet-2M的音频数据作为训练集,首次在国际上达到了50 mAP的性能指标,标志着小米声音识别算法在该领域中排名第一。 据了解,Google将AudioSet数据集分为三个子集,前两个子集用于训练,合并后形成了“AudioSet-2M”数据集。小米的声音识别算法模型首次在这个数据集上突破了50 mAP的性能指标,刷新了音频标记技术的记录,成为目前性能最好的模型。 此外,小米还发布了一个Mini版模型,适用于资源受限的场景。该模型的参数量被压缩到了原模型的约九分之一,远小于其他机构的模型,但性能却优于其他所有机构。 这项技术的突破意味着小米的声音识别算法能力再次精进。小米的智能设备应用这项技术后,可以更敏锐地捕捉和识别环境声音,大幅提升硬件的智能化程度,从而为用户创造更加便捷的智能生活体验。 小米此次精进后的声音识别算法具有极高的应用价值。它能够广泛应用于小米的智能设备中,大幅提升用户的智能生活体验。此外,这项算法技术还广泛应用于小米机器人的研发中,大幅提升了机器人的感知能力。人形机器人CyberOne可以识别85种环境声音,能够通过听觉感知6类、45种人类情绪。而小米第二代仿生四足机器人CyberDog 2则可以识别38种环境声音,实现更强大的动态响应能力。

    本文属于原创文章,如若转载,请注明来源:小米自研声音识别算法能力再精进,音频标记任务中排名第一https://news.zol.com.cn/832/8325661.html

    news.zol.com.cn true https://news.zol.com.cn/832/8325661.html report 1073 小米自研的声音识别算法在音频标记任务中取得重要突破。该算法以公开数据集AudioSet-2M的音频数据作为训练集,首次在国际上达到了50 mAP的性能指标,标志着小米声音识别算法在该领域中排名第一。 据了解,Google将AudioSet数据集分为三个子集,前两个子集用于训练,合并...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错