9月22日消息,生成式人工智能(AI)正风靡全球,与AI进行聊天的用户对文本转语音的自然性和表现力提出了更高的要求。为满足这一需求,微软今天宣布推出了四款全新的TTS(Text-to-Speech)语音模型,分别是en-US-AndrewNeural、en-US-BrianNeural、en-US-EmmaNerual和zh-CN-YunjieNeural,目前已在美国东部、东南亚和西欧三个市场提供公共预览版。
据了解,这四款TTS语音模型旨在为用户提供更加自然的语音交互体验,使聊天过程更加贴近现实、更加自然,更具吸引力。这意味着在与AI进行对话时,用户将能够听到更加流畅、自然和富有情感的语音输出。
微软在新闻稿中展示了这四款TTS语音模型的对比效果,并演示了它们在不同语气风格下的表现。这些演示可通过提供的链接进行深入体验。
此外,微软还提到开发者可以利用Azure Speech SDK和REST API,将这些先进的语音模型集成到他们现有的应用程序中。这为开发者提供了机会,利用这些语音模型来增强他们应用程序中的语音交互功能,从而创建更智能、更人性化的语音助手、虚拟角色和其他语音应用程序。这一举措将推动语音技术在各个领域的应用和创新,为用户带来更出色的体验。