开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >自适应语音合成实验方案

自适应语音合成实验方案

原创

作者头像

b.ug

发布于 2022-10-17 20:21:10

3680

发布于 2022-10-17 20:21:10

举报

文章被收录于专栏：实验实验

自适应语音合成也可以认为是训练一个多说话人模型（也就是预训练模型），主要是通过一个256维的讲者嵌入来表征不同说话人，将表征后的讲者嵌入加入到改进后的声学模型中，利用该模型提取训练集内不同说话人的时长、能量、音高等音频信息，进而得到梅尔频谱的音频表征形式，而在最后的声码器部分则选择使用Parallel WaveGAN和MelGAN分别进行实验。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

原创声明：本文系作者授权腾讯云开发者社区发表，未经许可，不得转载。

如有侵权，请联系 cloudcommunity@tencent.com 删除。

评论

登录后参与评论

0 条评论

热度

最新

LV.

相关产品与服务

语音合成

语音合成（Text To Speech，TTS）满足将文本转化成拟人化语音的需求，打通人机交互闭环。提供多场景、多语言的音色选择，支持 SSML 标记语言，支持自定义音量、语速等参数，让发音更专业、更符合场景需求。语音合成广泛适用于智能客服、有声阅读、新闻播报、人机交互等业务场景。

产品介绍产品文档

录音文件识别、一句话识别等多款语音产品新用户14.9元起