热点:

    谷歌开源Live Transcribe语音识别转文字工具

      [  中关村在线 原创  ]   作者:张金梁   |  责编:张金梁

    中关村在线消息:谷歌在其开源博客中宣布开源 Android语音识别转录工具——Live Transcribe的语音引擎,它可以将语音或对话实时转录为文字,还能够为听障人士提供帮助。

    谷歌开源Live Transcribe语音识别转文字工具
    谷歌开源Live Transcribe语音识别转文字工具

    Live Transcribe 是谷歌于今年2月推出的一款Android应用程序,它的语音识别由谷歌最先进的Cloud Speech API提供。但是,依赖于云引入了一些复杂性,不断变化的网络连接、数据成本和延迟等等都带来一些考验。因此,谷歌把它开源出来,希望开发人员在已有的基础上进一步构建和开发。

    Cloud Speech API目前无法支持无限的音频流,团队采取了一些措施来解决这一难题,例如在达到超时之前关闭并重新启动流式传输请求,这将有效减少会话中丢失的文本量。

    值得一提的是,Live Transcribe支持超过70种语言,并能够根据语音自动识别语种,其中也包括中文。

    另外,由于是提供实时语音转录,转录出来的文本会随着语音的输入不断发生变化,降低延迟自然十分必要。该引擎能够大大降低延迟率,这都要归功于它的自定义Opus编码器。

    (文中图片来自互联网)

    本文属于原创文章,如若转载,请注明来源:谷歌开源Live Transcribe语音识别转文字工具//news.zol.com.cn/724/7246779.html

    news.zol.com.cn true //news.zol.com.cn/724/7246779.html report 891 中关村在线消息:谷歌在其开源博客中宣布开源 Android语音识别转录工具——Live Transcribe的语音引擎,它可以将语音或对话实时转录为文字,还能够为听障人士提供帮助。谷歌开源Live Transcribe语音识别转文字工具Live Transcribe 是谷歌于今年2月推出的一款A...
    • 猜你喜欢
    • 最新
    • 精选
    • 相关
    推荐问答
    提问
    0

    下载ZOL APP
    秒看最新热品

    内容纠错