期刊屋 > 计算机

基于WaveNet的端到端语音合成方法

【摘要】针对端到端语音合成系统中Griffin-Lim算法恢复相位信息合成语音保真度较低、人工处理痕迹明显的问题，提出了一种基于WaveNet网络架构的端到端语音合成方法。以序列映射Seq2Seq结构为基础，首先将输入文本转化为one-hot向量，然后引入注意力机制获取梅尔声谱图，最后利用WaveNet后端处理网络重构语音信号的相位信息，从而将梅尔频谱特征逆变换为时域波形样本。实验的测试语料为LJSpeech-1.0和THchs-30，针对英语、汉语两个语种3.02，在合成自然度方面优于采用Griffin-Lim算法的端进行了实验，实验结果表明平均意见得分（MOS）分别为3.31、到端语音合成系统以及参数式语音合成系统。

【基于WaveNet的端到端语音合成方法】相关的文章

计算机最新帖子

1五阶WENO格式求解一维Euler方程
2基于漏磁检测机理的钢丝绳小缺陷精确化识别系统研究
3一种鲁棒的单目视觉里程计算法
4基于分解卷积神经网络的文本情感分析
5考虑异质车辆和顾客满意度的冷藏品配送路径优化
6耦合辅助信息的矩阵分解推荐模型
7计算机专业高职学生个性化晚自习方法研究
8基于LOD技术的多分辨率海水场景实时仿真
9基于增量学习的SVM-KNN网络入侵检测方法
10基于Copeland集结算法的协同空战机动决策方法

基于WaveNet的端到端语音合成方法

【基于WaveNet的端到端语音合成方法】相关的文章

计算机 最新帖子

热门文章

计算机最新帖子