通山| 旺苍| 墨脱| 马祖| 富裕| 嵩明| 济阳| 易县| 昌黎| 响水| 崇州| 久治| 遂平| 兴国| 舞钢| 北安| 大丰| 新邵| 阳城| 哈尔滨| 龙泉驿| 瑞安| 乐东| 印江| 鸡东| 建宁| 丹凤| 渠县| 衡南| 屏边| 长武| 青冈| 乌海| 吴川| 武乡| 石台| 七台河| 武清| 清镇| 米脂| 万年| 潜江| 浮梁| 献县| 韩城| 红河| 沈阳| 阿克塞| 友好| 抚顺县| 三明| 杨凌| 驻马店| 华坪| 新建| 达坂城| 广平| 三台| 勐海| 建阳| 封开| 象州| 许昌| 崂山| 杭锦旗| 崇信| 漯河| 新乐| 集安| 新密| 澜沧| 汕头| 开江| 平舆| 德保| 丰顺| 阜宁| 带岭| 雄县| 伊宁县| 诸城| 通许| 金塔| 安化| 青田| 抚顺县| 万宁| 广平| 科尔沁右翼中旗| 成人创新教育

“倾听”1分钟 就能开口模仿人类“讲话”

2018-02-21 11:13:00 科技日报 分享
参与
标签:成天 希财新金融-金融产品门户 东小营

  

  资料图

  据《科学美国人》杂志网站2日报道,加拿大新创公司琴鸟(Lyrebird)发布了新款人工智能(AI)语音系统,其能通过分析讲话录音和对应文本以及两者之间的关联,在1分钟内模仿人类“讲话”,比如,模仿特朗普、奥巴马和希拉里三个人的声音展开一段对话。

  让声音听起来更自然,是计算机程序在将文字转换成语音过程中面临的核心挑战,即使目前最好的语音助手,如苹果公司的Siri和亚马逊公司的Alexa,一发声给人的第一感觉仍然是,“哇!这是计算机。”背后原因在于这些语音助手系统的工作原理:根据预录的声音文档整理出词汇,再通过另一个新的音频文档将这些词汇拼凑在一起发声。

  而琴鸟公司的AI使用了一种全新的语音合成系统,能在“倾听”过程中“掌握”每个人说话时字母、音位和单词的发音特点,通过推理并模仿这个人声音中的情感和语调,“说”出全新的语句。

  新系统使用模仿人脑思维的算法创建出一种人工神经网络,能利用深度学习技术将所听到的转换成语音,并仅靠任何人1分钟讲话内容,就能完全模仿这个人说话。其市场前景非常广阔,可用来改进个人人工智能助手、音频书籍以及残疾人语音系统等。

  开发该系统的蒙特利尔大学学习算法实验室博士后亚历山大·布瑞比森表示,在学会并模仿了几个人的声音后,再模仿任何一个新对象的语音就会变得更快,因此新语音系统不需太多信息,1分钟足以捕获某个人声音的核心特点。

  但美国卡内基梅隆大学语言技术研究所教授迪莫·鲍曼表示,琴鸟的语音系统和真正的人声之间还有差距。“我仔细听过琴鸟系统的发声,其带有背景噪音,以及微弱的机器人特征。而且,它还不能模仿人们在讲话中的呼吸和唇部运动,因此仍然能听出其计算机语音特征。”鲍曼说。他认为,语音系统真正令人信服地复制人声,还需再等几年。

责编:陶宗瑶(实习生)
和平街居委会 山口镇 谢家塘 巴州药材公司 高塔社区
孔府 求水岭 武乡县 中路南社区 大影壁
成人创新教育 成人创新教育 时尚佳人网 乐透乐博彩论坛 希财新金融-金融产品门户
奥斯卡娱乐官网 百家达娱乐 百家乐打法分析 智尊国际娱乐城有限公司专题 经典斗地主单机版
水浒传游戏机在线玩 2015欧洲杯4强 21点赌博技巧 大三巴在线娱乐网 PT娱乐免费彩金
百家乐代理百家乐技巧 任你博现场娱乐城 2014世界杯赌球规则专题 波克斗地主推广号 太阳城二折毛笔伞
刀锋战士 g3国际线上娱乐唯 久博国际娱乐城唯 m88明升注册 EA平台娱乐