您当前的位置：首页 > 科技新闻 > 互联网新闻 > 未来的Alexa合成音效让声音变得更好听

未来的Alexa合成音效让声音变得更好听

时间：2018-11-20 来源：手机中国作者：

　　你是否已经厌倦了Alexa那古板乏味的腔调? 多亏了新的人工智能技术，亚马逊也许很快就能让语音助手掌握新的讲话风格。在最新发布的论文和博客中，亚马逊提供了更多关于Alexa可以学习新的讲话风格的文本语音转化系统的细节。

　　“对用户来说，神经网络生成的合成语音听上去比由语音数据库中的片段拼接而成的结果更自然，”亚马逊学术理事Trevor Wood写道。“得益于我们系统的灵活性，我们可以很容易地改变合成语音的讲话风格。”

图片来自亚马逊

　　这个亚马逊的神经网络语音文字转化系统包含了两个组件。第一个是将音素顺序转换为更加直观地展现声音变化的声谱，另一个是把声谱转化为连续声音信号的语音编码器。音素声谱转化系统是序列对序列的，也就是说它并不只是从对应的输入量中计算出输出量而不考虑输出序列。亚马逊的科学家用音素序列和声谱序列训练它，并配合以能够识别具体讲话风格的“风格编码”。

　　人工智能的输出量将会进入语音编码器并最终形成高质量的波形图。语音编码器可以处理任何讲话者的声谱，不管自身是否在此前的训练过程中接触过，人工智能也不需要使用讲话者编码。结果便是我们获得了由大量中性风格讲话数据以及只有几小时目标风格的补充性数据构成的模型训练方法，和一个能分辨讲话风格中独立或独有元素的人工智能系统。

图片来自亚马逊

　　“当面对一种讲话风格的代码时，这个网络会预测合适该风格的韵律模式并将其应用于一个独立生成的表现形式，” Wood解释道：“而借助一些额外训练数据实现的高质量标准能够引起讲话风格的快速扩张发展。”

　　根据亚马逊的调查，相较于传统方法拼接而成的语音，听众更喜欢由该神经网络语音声音转化系统生成的声音。 Wood写道：“这种偏好反映了该系统所带来的语音质量的提升。而相关新闻播报员的声音的提高则展现了我们系统根据文本生成讲话风格的能力。”

关键词：

上一篇：LG Xboom AI ThinQ发售促销价200美元

下一篇：大众集团坦言论自动驾驶不如Waymo！

三封贺电定义中国航天新高度
开展深空探测、建设与运营空间站、建设与运营全球卫星导航星座系统都是中国航天“旗舰”工程，也被认为是世界航天强国的“三大标配”，是对国家科技实力和综合国力的...

关键词：火星探测器天问一号中国空间站
“天眼”为何受到全球热切关注？
世界最大的单口径射电望远镜，能刺穿“光年之外”，能洞悉宇宙“前世”……“中国天眼”开放运行第一年，成果即入选《自然》十大科学发现。...

关键词：射电望远镜
北斗能够导航的秘密卫星的排兵布阵、星载原子钟、电磁波频率……缺一不可
6月23日,北斗家族最后一颗全球组网卫星成功发射,标志着我国提前半年全面完成北斗全球卫星导航系统星座部署。...

关键词：北斗导航
14年前，正是他设计了探月工程标识。他想对年轻人说—— 抬起头，多看看头顶的星空
出生在绍兴的顾永江在上海做设计师，却和中国航天事业有着一段不解之缘。...

关键词：月球火星
帕克太阳探测器传回首批数据：揭晓太阳神秘面纱
在完成最接近太阳的飞掠任务几周之后，美国国家航空航天局（NASA）的帕克太阳探测器开始向地球传回数据。...

关键词：太阳探测器
中国长征系列运载火箭2017年完成16次航天发射
2017年12月11日0时40分，中国在西昌卫星发射中心用长征三号乙运载火箭，成功将阿尔及利亚一号通信卫星发射升空。这是长征系列运载火箭的第258次飞行。...

关键词：运载火箭