近日,微软宣布推出了四款具有自然语音交互能力的文本转语音(TTS)模型,分别是en-US-AndrewNeural,en-US-BrianNeural,en-US-EmmaNerual和zh-CN-YunjieNeural。这四种TTS语音模型将在美国东部、东南亚和西欧三个市场进行公共预览测试。 微软表示,这四款TTS语音模型能够提供自然、真实且有吸引力的语音交互体验,使聊天声音更加贴近现实,更为自然。他们还展示了四款TTS语音模型的对比效果,并演示了不同的语气风格。开发者可以通过Azure Speech SDK、REST API和Azure OpenAI将这种新型语音技术集成到现有的应用程序中。
本文属于原创文章,如若转载,请注明来源:微软推四款语音合成模型:自然且真实https://news.zol.com.cn/833/8337909.html