微软 Azure 智能语音合成全面升级到 48kHz 高保真模型

更新时间：2022-11-17 20:07:44作者：bjjmlv

11 月 17 日消息，微软 Azure 神经网络文本转语音服务 (又称“Neural TTS”，“智能语音合成”) 能帮助用户将文本转换为逼真的人工智能声音，它适用于多种应用场景，包括智能语音助手、客服对话机器人、有声内容朗读、游戏角色语音等。在过去的几个月中，微软 Azure 智能语音合成技术在语音自然度、声音丰富度和多语言支持等方面取得了快速进展。

今天微软官方为大家带来了最新的神经网络语音合成声码器 HiFiNet2 。

声码器是 TTS 中的关键组件之一，它基于输入的文本或声学特征来合成音频样本。目前，通过 HiFiNet2 声码器技术，微软已经将微软 Azure 智能语音合成产品全面升级到 48kHz 声音模型，进一步为用户带来更高保真、高效率和可扩展的 AI 语音音质体验。这项更新包括 400 多个音色，覆盖全球超过 140 个国家和地区的语言。

48kHz 语音模型

在文本转语音技术中，音频的保真度是用来衡量音质的一项重要标准。高保真声音不但可以给用户传达更丰富、更细腻的音质，同时还可以将音色的失真和变形降至最低。随着采样率的提升，听众可以听到更精准的细节和更真实的音色。在视频配音、游戏和唱歌等需要更精细、更沉浸的声音体验的复杂场景中，更高保真度的输出（如 48kHz 采样率）将给用户带去前所未有的全新感官体验。

现在，随着 Azure 深度神经网络语音合成服务将全平台 AI 声音升级到 48kHz 采样率，微软率先在业界为 AI 声音用户带来真正高保真度的声音体验。

微软 Azure 智能语音合成全面升级到 48kHz 高保真模型

微软 Azure 智能语音合成技术更多信息介绍，点此查看。

上一篇：微软 Win11 将获新特性：任务栏系统托盘时钟区域可显示秒数
下一篇：成本控制失败，微软Xbox Keystone确认难产

微软 Azure 智能语音合成全面升级到 48kHz 高保真模型

微软 Azure 智能语音合成全面升级到 48kHz 高保真模型相关教程

热门推荐