百度AI科学家欢迎大家来技术公开课现场交流

安卓资讯(news.hiapk.com) 编辑:匿名 时间:2017-07-04 手机扫描分享

7月5日,一场全球开发者的狂欢 “Baidu Create 2017” 将于北京国家会议中心启幕,届时预计将有近5000名开发者和生态合作伙伴参与此次大会。而作为本次大会的主办者,百度当然也为大家提供了与自家AI科学家切磋交流的大好机会。

哪些科学家会在现场做公开课,

先来剧透一下:

远场语音识别与唤醒:李先刚

为了解决当代人类生活第一大痛点:懒 :) ,许多阅读类App都希望可以解放用户的手和眼,让用户可以利用碎片化时间,像听音乐一样的去听书。但最常见的就是听起来不太像“人话”……在与机器进行语音交谈时,人们都更倾向于希望机器的声音有一定的语调和情感,这样比起那些机械、一字一顿的机器声更受欢迎。主要还是因为让人感觉「我在跟一个人说话」。

今年3 月,百度首次向外界推出了Deep Voice(深度语音系统),该系统是一个完全由深度神经网络构建的语音转文本(TTS,Text-to-Speech)系统,最大的亮点在于能实时合成人工语音。

Deep Voice 2 更可以实时合成上百种口音的音频。机器完成每个口音模仿的学习仅需半小时的时间,而在这个语音合成的过程中不需要任何的人工调整。

在本次百度AI开发者大会的“技术公开课”环节,百度语音技术部识别技术负责人李先刚博士将会出席,并就“百度远场语音识别与唤醒”这一主题同大家进行现场交流。

理解与交互技术平台UNIT:孙珂

相同的词组成的短语或句子,不同的语序可表达不同的语义,例如「深度学习」和「学习深度」。更进一步,还存在句法结构问题,例如「从北京到上海高铁」和「从上海到北京高铁「虽然含有的词语完全相同,但其语义完全不同。而「北京队打败了广东队」和「广东队被北京队打败了」又语义完全相同。

理解这些状况对于人类而言尚且有些难度,为了让机器掌握语义理解技能,AI科学家做了许多探索。

自然语音处理技术是百度积累最多的AI技术之一。百度NLP设计研发的有监督的神经网络语义匹配模型 SimNet,可以大幅度提升语义匹配计算的效果。

SimNet 在语义表示上沿袭了隐式连续向量表示的方式,但对语义匹配问题在深度学习框架下进行了 End-to-End 的建模,将词语的 Embedding 表示与句篇的语义表示、语义的向量表示与匹配度计算、文本对的匹配度计算与 pair-wise 的有监督学习全部统一在一个整体框架内。

▲ SimNet框架

在本次百度AI开发者大会的“技术公开课”上,百度知心项目自然语言技术负责人、资深研发工程师、孙珂博士将就“理解与交互技术平台UNIT”这一主题与大家共同探讨。

更多AI科学家,都在现场!

细粒度菜品识别:丁二锐

前段时间,一则“吃烤鱼发现身世之谜”的段子在网上热传,#被烤鱼征服找到亲生父母#这一话题也急剧升温。而事实上,在这个看似欢脱又离奇的故事背后,主人公得以成功找到亲生父母,借助的是百度的人脸识别技术。《被烤鱼征服的背后,是什么在真正帮助被拐27年的他回家?》点击可查看详情。

AI技术能够服务于人让人无比振奋,而事实上,百度深度学习在人脸识别、文字识别、通用图像识别、细粒度图像识别等许多方面都已形成比较完善的技术解决方案,产生了许多实际应用案例。

2016年乌镇互联网世界大会上,百度糯米上线了全球第一款菜品识别功能。这一功能依托于百度深度学习实验室强大的细粒度图片识别技术,可以在100毫秒内分析用户上传的菜品图片,寻找区分菜品和库里图片的视觉特征,甚至找到人类都无法辨别的细节,对于美食图片的识别率已经达到90%。它不仅能区分宫保鸡丁和酱爆鸡丁这种高相似度的菜品,食物的卡路里也一扫即知,让你在晒美食拉仇恨的同时,还能保持膳食的营养均衡。

▲ 细粒度菜品识别技术

感兴趣的同学,欢迎来现场“捕捉”百度深度学习研究院技术专家丁二锐博士等多位图像识别的科学家哟!

计算机视觉:包英泽

眼睛是人类接触外部世界的第一感官。而对计算机来说,它们的“眼睛”就是计算机视觉感知技术。正是由于这种技术,计算机才从只会执行命令的机器,走上了成为有智慧的人工智能的第一步。

▲ xPerception 的智能感知模块可帮助家用机器人设备实现定位功能

曾经的硅谷创业公司xPerception、现百度IDL机器人视觉团队,就希望能够赋予世界上的机器人这样的感知能力。他们开发的智能感知计算模块,集成了感知、定位、避障和导航技术。他们的感知技术,为第三方手机、VR设备、机器人等提供包括定位、识别、3D重建等功能在内的软硬件一体化解决方案,引领下一代硬件产品进入智能时代。

xPerception 联合创始人、Magic Leap 早期核心工程师、现百度机器人视觉技术负责人包英泽博士等机器人视觉科学家,也会在展区欢迎大家的到来。如果你也是计算机视觉领域的同好,欢迎来现场“蹲守”咯~

既然是要听课,当然要听过瘾咯。本次技术公开课的课程安排非常丰富,除了以上提到的两门,还有“AI在自动驾驶中的应用”、“DuerOS Conversational Service 协议介绍及设备端应用开发指南”、“基于百度效率云实现高效研发与代码协作”等等许多技术课题。

7月5日,百度AI开发者大会现场,将会设立IDG、AIG、Web生态、DuerOS、百度云、数据中心六大分论坛及对应的技术公开课。百度AI科学家们都在这儿了,欢迎你来百度AI开发者大会技术公开课现场切磋交流~

(create.baidu.com)现在还可以抢购哦~手~慢~无~

中国开发者不必再熬夜刷别人的大会,百度Create 2017等你来!

[ 参考资料 ]

1、91资讯站:从实时语音合成到上百种口音的进阶,百度 Deep Voice 2 模仿人声的能力更强了。

http://news.91.com/all/s592862213906.html

2、机器之心:百度NLP | 神经网络语义匹配技术。

http://dwz.cn/6ecSzD

3、环球网:刷脸、刷菜、无人车,走进乌镇就像走进未来。

http://tech.huanqiu.com/gundong/2016-11/9675136.html

4、硅星闻:xPerception:解决AI和人类之间的“最后一公里”。

https://baijia.baidu.com/s?old_id=539328

你可能更多想了解的内容


(来源:网络,如对本网转载内容、版权有异议,请联系我们: hiapknews@baidu.com)
  • 手机
    访问
    手机扫描二维码访问
  • 返回
    顶部