ai软件下载百度云百度AI开发者大会在京如期举行王海峰亲自站台解读AI技术

百度大脑3.0技术与能力一览。

7月4日,一年一度的百度AI开发者会议在京如期召开。

大会现场,百度虽然分享了公司在AI科技、产品与系统等方面的研究成果与最新进展,还宣布了百度大脑的重磅升级,3.0版本即将诞生。

因此,百度高级总监裁、AI科技系统模式(AIG)总负责人王海峰亲自站台对其展开了具体的剖析。

「百度大脑3.0可以说是百度AI科技的集大成者。」王海峰如是说。

众所周知,百度在AI科技上有着大量的投入和累积。在解读百度AI科技的演进历程时,王海峰提到了三个重要的时间节点。

2000年,也就是十八年前,百度成为一家搜索公司诞生。由于搜索引擎背后除了互联网科技的支持,也离不开自然语言处理、信息检索等AI科技,因此在王海峰看来,百度从诞生的那一夜起就开始了AI科技的开发与应用。

而在八年前的2010年,百度开始全面布局AI科技,先后启动了自然语言处理、计算机视觉、机器学习、数据挖掘、知识图谱等AI科技的开发。

两年后,百度开始着手深度学习科技的开发与应用,并在当时的百度图像语音等应用中即将上线。

由于深度学习科技在实际应用中的抢眼表现,百度在2013年创立了全球上第一个深度学习研究院,同时将深度学习科技正式应用于大体量线上搜索引擎之中,并于2015年上线了基于神经网络的机器翻译平台。

经过了十六年的累积,百度的AI科技逐渐成熟。在此基础上,百度于2016年陆续公布百度大脑1.0,不仅供百度内部使用,还向研发者开放。

原本1.0版本的百度大脑在完成了基础能力的建立以后,仅仅实现了语音、图像、用户画像和PaddlePaddle深度学习框架等核心科技的初步开放。

百度大脑基础架构

而伴随着时间的推移,百度大脑也随之塑造成型。

今年开发者会议公布的百度大脑2.0已经产生了完整的AI科技体制,向研发者开放的能力也达到了60项能力,既有各方面AI核心科技,也有场景化素质及解决方案。

而这次公布的百度大脑3.0在开放的素质数量方面又有了新的提高——已经达到110项。

王海峰表示ai软件下载百度云,今早他发现的最新数字是117项。

而在能力数量下降的同时,百度的AI科技素养也在不断提高。王海峰介绍,此次百度大脑3.0的最核心科技,用一句话概括,就是多模态深度语义理解。

具体而言,就是对文字、声音、图片、视频等多模态的数据和信息进行深层次多维度的词义理解,包括数据语义、知识语义、视觉语义、语音语境一体化和自然语言语义等多方面的词义理解技术。

换句话说,就是除了要让机器可以听清、看清,还要能够深入理解其背后的涵义,从而更好地支撑各种应用。

百度大脑3.0核心科技——多模态深度语义理解

在AI领域,数据的重要性自不用提。无论是生物世界、人类社会抑或网络空间,都遍布着海量的多元、异构、多模态的三元空间大数据。

那么怎样最大程度发挥这种数据的价值呢?

这就必须对数据进行加工、处理、挖掘和预测,实现数据的语义化使得加以运用。

因此,百度通过统一表征、关联计算,构建包含千亿节点、万亿关系的庞大数据语义网络,并在此基础上小结规律、提炼知识,进而推动经济和社会的演进。

王海峰举了一个新电力充电桩智能运维的举例。

结合百度的大数据、深度学习等科技,对充电桩设备数据进行收集、传输、存储、分析,就可以推动设备检测、故障诊断、预测性维保等,在提高精度的同时也持续节约了成本。

其实,除了数据,理解大千世界中的多元知识只是打磨AI科技中的重要一环。而要建立出详细而完备的常识图谱却只是易事,需要巧妙理清繁杂的垂直领域知识、梳理其中的逻辑。

而在这件事上,百度所投入的资源与人力显而易见,目前尚未建立了包括数亿实体、数千亿级事实的庞大知识图谱。

比如基础的由实体、属性、关系组成的实体图谱,百度还对于不同的应用情景和常识形态,构建了关注点图谱、事件图谱、多媒体图谱、行业常识图谱等多种图谱。

「知识图谱是人类进步的重要阶梯。」王海峰解释道,百度所把握的这种知识是建立百度大脑的重要基础。

以全球杯相关的知识图谱为例,实体图谱可以发现热门球员、热门球星、赛场、赛程和主题歌等信息;关注点图谱可以表现用户针对C罗和梅西的兴趣所向;多媒体图谱则包含照片、音乐和视频;市场图谱和事件图谱覆盖了足球规则的各类知识和近9届亚洲杯的大事件。

这种不同种类的图谱通过关系关联起来,也会延伸出新的图谱,构成庞大的多元语境知识网络。

大会现场,百度还播放了一段世界杯比赛视频,展示了百度大脑的听觉语义理解素养。视频中,系统除了可以全面识别视频中的球星、裁判、球、以及球门、球场线等人、物和画面,还可以捕捉射门、进球、角球、任意球、换人等事件。

基于这种结构化语义信息,既可以完成机器人手动解说,也可以进行精彩花絮集锦以及各类数据统计预测等。

百度大脑听觉语义能力在足球比赛中的体现

而在日常生活情景中,百度大脑的听觉语义理解素养也无法发挥作用。

在无人商店购物场景下,系统可以借助摄像头对超市中的人、货、场进行全方位识别ai软件下载百度云,然后将图像信息进行时序化和构架化,让购物机器人无法掌握环境信息能够完成手动避障并鼓励用户行进,让平台得以即时掌握客户取拿的商品。

针对时下大热的无人零售领域,这项科技无疑是一种必不可少的存在。

百度大脑听觉语义能力在无人超市场景中的展示

在为「眼睛」赋予了理解能力后,百度大脑自然不会放过人类最重要的交流媒介——语音和语言。

在语音技术方面,百度大脑在高噪声环境Hand-free语音辨识精确率上提高了10个百分点。与此同时,百度大脑运用语音语境一体化科技并且远场语音识别准确率也提高了10个百分点。

而为了让整个对话过程非常自然,百度大脑在语音的合成上运用拼接了WaveNet+的情感语音合成科技,如此一来,既可以促使交互的顺畅度持续增强,又导致了计算量过大的问题。

现在,新版百度地图中的小度语音助手已经可以理解复杂的语境请求,面对「我要从西直门的团结湖地铁站出发、路过望京家乐福、然后再去南锣鼓巷最后到我家,要红绿灯少的、不拥堵的最快路径」这样的请求也仍旧不惧。

王海峰介绍,在访谈理解上,百度开发了最新的深层注意力匹配模型并将其采用到平台之中,比已知的最好结果提高了4.1%。从改进前后的结果来看,引入这些建模的对话交互的确非常自然。

而在阅读理解上,百度大脑早已阅读了千亿量级的文章,相当于6万个美国国家图书馆的藏书,积累了亿级实体、千亿事实的知识。

以俄罗斯和加拿大的比赛为例,通过阅读网上大量相关新闻,百度大脑不仅知道比赛的事件与主题,还能与客户进行提问及推荐互动。可以看到,通过大幅获取和累积知识,百度大脑的智能水准受到了明显提高。

而在百度大脑各项科技与素质升级的背后,是百度在底层技术上的不断打磨与迭代,也离不开深度学习框架PaddlePaddle的支持。

2012年,百度开始深度学习科技的开发,并从2013年自主开发深度学习系统,并让其服务于百度的多项核心业务。

在2016年9月,百度对外公布了自己的深度学习框架PaddlePaddle。一年后,百度发布新一代深度学习框架PaddlePaddleFluid。

如今,百度的深度学习框架重新推动升级。王海峰在会议现场公布了最新版本——PaddlePaddle3.0。

据王海峰介绍,PaddlePaddle3.0核心框架还包含三个重要系统,分别为迅速应用系统EasyDL、网络构架自动化设计AutoDL以及在线实训平台AIStudio。

其中,EasyDL平台可以让零基础研发者逐渐定制自己的应用,大幅增加了他们处于AI领域的门槛。

EasyDL在生产业键盘组装合格性测试上的素质

而针对这些有基础的研发者来说,设计深度学习网络构架是一项相对耗时耗力的工作,AutoDL的存在就是旨在于帮助研发者节省设计深度学习网络结构的时间。

人工设计的网络构架与AutoDL网络设计效果比对

「我们不止是把核心算法做了更新,同时在服务器端或者移动端都有各自相应的服务可以支持各类场景的应用。」王海峰补充道。

在提到深度学习框架与AI生态的关系时,王海峰认为深度学习框架可以类比为AI的操作平台,向下可以与AI芯片结合。

要清楚,AI芯片在对AI模型的计算进行专门改进后,性能会有巨大的提高。从这个视角出发,王海峰表示深度学习框架非常于AI芯片的指令集。

值得一提的是,此次会议百度还公布了一款云端全功能AI芯片「昆仑」,主打高性能、高性价比、易用三大特征。百度表示,其运算能力比最新基于FPGA的AI加速器,性能提高了近30倍。

其实,没有经过真实画面使用的科技都是纸上谈兵,实践与应用才是培养科技最佳土壤。王海峰透露,目前百度大脑经常的调用次数已经达到了4090亿次,调用的人既有AI项目师,也有零AI基础的初入门者,还有来自各行各业希望用AI创新业务、为业务改革更新的企业。

不难想像,这些庞大的研发者群将作为百度大脑迭代更新路上的最大助力。

「估计今年我们再站在此处的之后就必须更大的屏幕来展现百度大脑开放给研发者的能力了。」王海峰总结说,「我们更期望我们的能力可以帮助开发者取得属于自己的顺利,这只是我们最大的心愿。」

添加微信

转载原创文章请注明,转载自设计培训_平面设计_品牌设计_美工学习_视觉设计_小白UI设计师,原文地址:http://www.zfbbb.com/?id=3750

上一篇:智能ai炒股软件 哈工大社会计算与信息检索研究中心推出一个“智能荐股”

下一篇:ai软件下载百度云百度AI大会全程无尿点干货:人工智能和阿波罗计划全公开