首页 > 互联网那点事 > 百度大脑 这样思考
2014
07-03

百度大脑 这样思考

巴西世界杯足球赛激战正酣,有爆冷出局的,也有意外晋级的。本届比赛虽然没有了“预言帝”章鱼保罗,但是预测比赛结果已经有了新工具—能够分析数据、学习思考的人工智能。目前,百度公司就有这样一个叫做“百度大脑”的项目,用计算机加上深度学习等人工智能技术去模拟人脑的思维,这个机器大脑到底是如何思考的?让我们一起来看看。

—编 者

能做什么

提高语音识别、图像搜索准确率,助力大数据应用推理预测

德国夺冠率17%,阿根廷夺冠率12.9%……打开百度的大数据引擎,点开世界杯预测一栏,可以看到每个参赛队伍的夺冠概率分析—这都是根据大数据实时分析得出的结果。

这个大数据引擎是如何运转的?与人类思考一样,大数据引擎对数据的搜索分析及预测也通过一个机器大脑—百度大脑来实现。这个“大脑”用计算机模拟人脑神经网络,包括模拟人脑学习分析的能力,从而通过多层的学习模型和海量的训练数据进行数据智能分析,然后做出预测。

“从功能上来定义百度大脑,可以说它是以大规模机器学习和深度学习为基础的人工智能在搜索引擎中的应用,旨在优化搜索业务和提升用户体验。”百度高级副总裁王劲举例说明,比如目前用户已经不满足于传统搜索引擎只能提供网页链接,他们希望能够通过搜索引擎来直接找到答案。并且需要更加个性化的搜索体验,希望使用更加自然的人机交互方式,比如通过语音图像等形式让机器理解,完成信息与用户需求的精准匹配。据悉,目前中国每天都有60亿次的搜索需求。

目前,通过百度大脑的思考,语音识别的相对错误率降低了20%—30%,扫描文本图像生成汉字文本的相对错误率降低了30%,相似图像搜索效果显著超过同类产品,通过大数据显著提升广告点击率,提升网页搜索排序质量等等。

同时百度大脑也能通过推理决策为大数据的应用提供助力,社会价值初步显现。除了预测世界杯外,还能预测高考择校、城市旅游热度、景点旅游舒适度、疾病等。比如,通过“疾病预测”可以知道所处城市是否处于流感高发期,大家都去哪个医院看病,从而了解当前流行病态势及未来7天的变化趋势。

百度大数据引擎这样描述预测原理:“每天网民在百度搜索大量流行病相关信息,汇聚起来就有了统计规律,经过一段时间的积累,可以形成一个个预测模型,预测未来疾病的活跃指数”。分析数据形成预测模型,其中就有百度大脑的“思考”。

怎样工作

模仿人类大脑的神经网络,通过多层次的网络模型结构认知事物

今年4月,百度董事长兼首席执行官李彦宏首度披露百度大脑这一项目。在王劲看来,百度大脑的应运而生,受多方面因素的推动。

“首先是服务器的能力和云计算的能力有了很大突破,数万台服务器能够集合起来像一台服务器一样工作。其次是大数据的积累达到了相当大的规模。”王劲分析。2013年全球每天产生25PB(拍字节,资讯计量单位)数据,相当于1500个国家图书馆信息量总和。互联网技术的突飞猛进及数据库的积累为人工智能提供了突破的环境与机遇。

“最重要的推动是深度学习的不断演进迭代。”王劲介绍,人工智能的核心是机器学习技术,即通过算法使机器能从大量历史数据中学习规律,从而对新的样本做智能识别或对未来做预测。从上世纪80年代末以来,机器学习的发展大致经历了两次浪潮:浅层学习和深度学习。

深度学习更接近于人类的学习方式,它通过模仿人类大脑行为的神经网络,利用更多层次的网络模型结构来收集事物的外形、声音等信息,进行感知理解并产生相应行为。比如,要让机器“认识”物体,就需要若干层网络,首先要建立最基本的一层人工神经元,用来探知物体的边缘形状等基本信息,第二层神经元需要将第一层感知到的物体边缘形状拼凑起来,认知物体形状。然后第三层进一步拼凑信息从而得出物体整体的形态。“这些过程都是机器自主完成的,并不需要工程师在任何环节输入信息。”王劲强调。

深度学习可以说是人工智能技术取得新突破必须迈出的第一步。为此,百度请来了世界三大人工智能专家之一的吴恩达。吴恩达的一个著名的深度学习实验就是让机器认识了“猫”这种动物:搭建一个1.6万台电脑组成的网络,向这个网络展示1000万段随机选取的视频。经过一段时间“学习”,该网络在没有外界干涉的条件下,自己认识到“猫”是一种怎样的动物,并成功找到了猫的照片,识别率为81.7%。吴恩达坦言,深度学习算法目前还比不上人脑的精确性和灵活性,但相信那一天定会到来。

李彦宏也曾评价,目前百度大脑“大约相当于两到三岁孩子的智力水平”,但是未来积累10到20年后,根据摩尔定律的发展速度,人工智能的“大脑”可能会发生质变,赶上人脑。

前景几何

人工智能技术得到全世界互联网巨头青睐,成为衡量科技创新能力的重要标志

目前,谷歌、IBM、微软、苹果、百度这些公司竞相开发深度学习技术,投入明显加大。比如谷歌收购了加拿大多伦多大学教授杰弗里·辛顿创建的人工智能机构,纽约大学数据科学中心的雅恩·立昆教授兼任脸书人工智能实验室的主管。

在美国,奥巴马政府支持筹建一项跨学科的科研项目“基于神经科学技术创新的人脑研究”。欧盟2013年初也提出了“人类大脑计划”,旨在用巨型计算机模拟整个人类大脑。

业内专家认为,人工智能代表了互联网的未来,是计算机科学发展的大势所趋,是国家产业变革和升级的重大机遇。在全球格局的竞争中,如果人工智能技术落后,不管是国家还是企业都处在非常不利的竞争地位。

王劲表示,世界范围内的人工智能竞争中,百度在人才方面与竞争者站在同一起跑线上,技术上各有短长,“我们要把人才和资源投入到最有希望的方向,大数据、深度学习是我们看到的最好的突破口。”将大数据、深度学习作为人工智能的突破口,百度在该领域的投入已经开始有所收获:不仅提高了搜索、地图、团购等产品的用户体验,同时给百度带来了收入上的提升,“在人工智能技术的商业化方面,百度在全世界范围内都是比较领先的。”

“未来百度会把技术提供给合作伙伴,合作伙伴把他们的数据提供给我们,帮助我们提升技术,这是一个共赢的机会,”王劲说,互联网正在对中国的经济带来很大变化,未来推动互联网发展和变革的仍将是技术。

对于这一点,百度的科学家们都深信不疑并为之兴奋:尽管人类大脑将生物秘密隐藏得还很深,但是“得人工智能者得天下”的时代已经到来了。

作者:赵展慧

最后编辑:
作者:修愚
wangqixing.com的主人,本站站长,很高兴认识您!
捐 赠如果您觉得这篇文章有用处,请支持作者!鼓励作者写出更好更多的文章!