
来源:U大侠 时间:2019-05-16 浏览:233

谷歌官方表示当前网络上所有的翻译系统都分为三个步骤:自动语音识别,将语音转换为文本;机器翻译,将文本转换为另一种语言;最后是文本转语音(TTS)合成,也就是将翻译好的文本生成语音。在这三个步骤衍生出了 Google Translate 等服务,不过这家科技巨头希望通过一个模型就实现语音的翻译,而不再需要借助文本这个中间步骤。
因为Translatotron这个系统避免了将任务分成不同阶段,所以可以拥有更加快速的翻译速度与转译错误。该系统使用频谱图作为输入并生成频谱图,同样依赖于神经声码器和扬声器编码器,这意味着系统在翻译后保留说话者的声音特征。
更多精彩内容,请关注U大侠官网或者关注U大侠官方微信公众号(搜索“U大侠”,或者扫描下方二维码即可)。

U大侠微信公众号
有装系统问题的小伙伴们也可以加入U大侠官方Q群(778773039),众多电脑大神将为大家一一解答。
2018-08-07 162
2019-08-23 116
2016-12-30 2241
2016-11-02 573
2015-11-11 313
2019-06-14 144
2015-12-29 505
2017-05-04 1232
2016-08-24 2320
2015-08-19 1308