百度吴恩达:语音技术让人机交互更便捷

2016-11-24 01:47:23 来源: 北京晨报 举报
0
分享到:
T + -

(原标题:百度吴恩达:语音技术让人机交互更便捷)

11月22日,百度语音开放平台三周年主题活动在北京召开,本次大会百度公开宣布开放四大语音技术——情感合成、远场方案、唤醒二期、长语音方案,为开发者提供免费接入入口。百度首席科学家吴恩达在主题演讲中表示,“语音是人类交流、人机交互最自然的方式,通过开放语音技术,百度希望可以推动语音功能产品繁荣的浪潮。”

在百度语音开放平台三周年之际,吴恩达还向外界公开介绍百度语音技术最新数据情况:注册开发者数量达到14万,在线识别请求量2016年每天达到1.4亿次,在线语音合成请求量则达到2亿次,再次证明了语音开放平台给开发者带来的实用价值。

此外,吴恩达还对人工智能的未来充满信心,他认为,人工智能的未来会体现在方方面面,例如陪伴机器人,个性化私教,音乐作曲,机器人医生等。

以下是吴恩达演讲实录(有删节):

大家好,非常高兴大家来参加百度语音开放平台三周年发布会。

百度大脑是什么呢?它最核心的几个技术部分为:语音、图像、自然语言处理、用户画像、机器学习平台。很多人使用百度的语音技术有两大原因,第一个原因,百度有非常领先的技术为他们的用户提供良好体验;第二个原因,我个人做了好几十年有关人工智能的项目,发现通常刚开始做一个项目的时候,只是需要语音技术,当做了几个月以后,你发现还需要图像技术或者自然语言处理技术等等。而如果你是使用百度大脑开放平台,你可以比较容易的选择真正需要的技术进行融合使用。

我个人对人工智能的未来充满信心,我希望未来我们会有陪伴机器人、个性化私教、音乐作曲、机器人医生等等。这些年人工智能技术发展的非常快,这给我们,也给你们带来很多新的机会,所以我们的目标就是把我们的人工智能技术输出给大家,希望可以支持你们在有潜力的项目上探索,在这些项目中获得良好的结果。

今天大会的主题是语音技术。大家可能已经知道,在很多最重要的百度产品中,我们已经支持语音输入,包括手机百度、百度地图、百度输入法。如果你还没有试过百度输入法,我希望你试一试,我本人非常喜欢。还有度秘,最近我们把度秘放入各类硬件中,比如小度机器人。度秘系统可以为客户点餐,把度秘和机器人融合,也可以让用户有新的体验。

这几年来,我们的团队在不断地优化语音识别系统,2012年开始使用DNN模型,之后开始用Sequence Discriminative Training,也开始使用LSTM模型,加上CTC,今年我们的团队开发了Deep CNN模型,效果在不断提高。此外,我们的语音合成模型也变得越来越好,现在百度在中文语音合成的能力是远远超过其他团队的。

我们的语音技术、自然语言处理技术、人机交互技术进步的这么快,2016年MIT科技评论我们的技术是2016年十大突破性技术之一。

未来语音技术在很多应用场景中都有很多机会,将为人机交互带来巨大的改变。举个例子,在智能家居的场景,我们希望未来你回家以后可以使用语音跟你的电视、遥控器、音箱、窗帘讲话,比如说希望你未来可以向你的电灯说,“电灯请打开”,它就明白你的命令,或者对遥控器说话,它就能非常方便的满足你的需求。其实智能家居只是一个应用场景,而在很多应用场景中,语音技术都可以带来人机交互非常大的改变。

今天我们已经知道——尤其是在手机端——语音输入比键盘打字更快、更方便、更准确。因为其实人和人交流最自然的办法还是语音。当然,人机交互不只是你跟电脑或者和设备讲话,你的电脑和设备也需要告诉你它的意见,所以我们的语音技术也可以让这些设备非常自然的交互。

最后,我想说,人工智能,尤其是语音技术这几年发展的很快。在百度大脑已经有好几种不同的人工智能技术,其中比较成熟的,就是我们的语音技术。语音技术已经给我们,也给更多的公司和开发者很多新的机会。我希望我们输出语音技术,为大家提供良好的服务,也希望我们的技术能够支持开发者进行新机会的探索,并在这些新机会中获得非常好的成果。谢谢大家!(李源)

netease 本文来源:北京晨报 责任编辑:王晓易_NE0011
分享到:
跟贴0
参与0
发贴
为您推荐
  • 推荐
  • 娱乐
  • 体育
  • 财经
  • 时尚
  • 科技
  • 军事
  • 汽车
+ 加载更多新闻
×

用一个月让你的字脱胎换骨

热点新闻

态度原创

阅读下一篇

返回网易首页 返回财经首页