微软公布全新TTS语音模型实现自然语音交互

9月22日消息，生成式人工智能(AI)正风靡全球，与AI进行聊天的用户对文本转语音的自然性和表现力提出了更高的要求。为满足这一需求，微软今天宣布推出了四款全新的TTS(Text-to-Speech)语音模型，分别是en-US-AndrewNeural、en-US-BrianNeural、en-US-EmmaNerual和zh-CN-YunjieNeural，目前已在美国东部、东南亚和西欧三个市场提供公共预览版。

据了解，这四款TTS语音模型旨在为用户提供更加自然的语音交互体验，使聊天过程更加贴近现实、更加自然，更具吸引力。这意味着在与AI进行对话时，用户将能够听到更加流畅、自然和富有情感的语音输出。

微软公布全新TTS语音模型实现自然语音交互1

微软在新闻稿中展示了这四款TTS语音模型的对比效果，并演示了它们在不同语气风格下的表现。这些演示可通过提供的链接进行深入体验。

此外，微软还提到开发者可以利用Azure Speech SDK和REST API，将这些先进的语音模型集成到他们现有的应用程序中。这为开发者提供了机会，利用这些语音模型来增强他们应用程序中的语音交互功能，从而创建更智能、更人性化的语音助手、虚拟角色和其他语音应用程序。这一举措将推动语音技术在各个领域的应用和创新，为用户带来更出色的体验。

微软公布全新TTS语音模型实现自然语音交互

相关内容

精品推荐