腾讯副总裁姚星：AI Lab现在主要在做的两件事

本文作者：小芹菜

2016-10-27 08:57

导语：可能你也会关心，腾讯的AI Lab需要大概多长时间能看到成果？

雷锋网按：本文整理自腾讯副总裁姚星在TEDx上的演讲，回顾了中国互联网20年经历的三个阶段、人工智能的发展趋势后，也介绍了他所领导的腾讯AI Lab的现状和规划。雷锋网做了不修改原意的编辑，增加了姚星在现场谈及AI Lab的内容。

虽然我们的工作很平凡也很普通，但是平凡中会折射出与众不同，今天我和大家分享一下腾讯认知的"科技的原力"。

原力是什么？按照《星球大战》电影的定义原力是"一种极大的能量"。

一组数据：10000亿，100亿，4小时

10000亿是如今全球IM一天的消息总量，这是个极大的数字，如果我们把它换算成书籍的容量，它大概是1亿册，相当于中国最大的图书馆——中国国家图书馆藏书量的5倍；

100亿是当今全球一天的图片分享总量，这个数字如果用数码相机一秒钟拍一种照片的速度衡量，它需要用300年才能产生100亿的照片，如果我们把这些照片连接起来，它可以绕地球50圈；

4小时是现在我们平均每天上网的时长，这个时间已经超过了我们观看电视的时间。

这些数字的背后也是信息产业的3个时代，过往的20年是信息时代快速发展的20年，信息产业的发展已经超过了其他产业，它经历了3个时代：分别是窄带时代、宽带时代和移动互联网时代。

三个时代

窄带时代，我们的网络传输效率比较低，主要解决的是沟通问题。

人们无需再像古人那样"飞鸽传书"或者通过传统的邮件进行通信。人们可以通过Internet实时传输我们的消息，我们可以结交更广阔的朋友，无论身处天涯海角，只要能连接上Internet，信息总是可以触手可及。

随着基础网络设施的发展，网络传输的效率和容量越来越大，我们进入了宽带时代。

在宽带时代人的诉求不再仅仅是沟通，更大的诉求是信息分享，"人人为我，我为人人"。人们在朋友之间分享快乐，总结教训；人们在更广阔的互联网世界里帮助他人，或者寻求帮助；人们在熟悉的、不熟悉的，认识的、不认识的人之间传递信息，分享信息。

随着3G/4G移动通信网络的发展，智能手机的普及，我们又进入到了移动互联网时代。

移动互联网时代人们不再像原来那样要在指定地点，特定时间段连接信息世界，人们可以每时每刻、随时随地连接互联网世界。

信息时代的发展推动了整个互联网产业的发展，也提升了我们的生活质量和水平，每个阶段都诞生了极具有代表性的互联网产品，它们的出现改变了人们的生活方式，也深深的影响了我们这代人的生活。

QQ就是窄带时代极具代表性的产品。大家还记得那个网络传输效率较低的年代google的首页吗？Google的首页为何如此简洁？

Google的诞生是1998年，也是身处窄带时代，如果看它的首页字节，大小是小于1024的，为什么要小于1024字节，因为以太网的MTU（也就是以太网最大传输单元）是1024，Google为了让用户在一个网络包中传输完成，所以它把页面大小降到了1024以下，这是一种极致传输的表现。

QQ的背后也蕴藏着诸多极致追求，早期的QQ客户端安装包是几十k的大小，是为了让用户更快下载，更方便使用。QQ后台的通讯协议是修改过TCP协议站的，之所以这样是因为QQ希望传输协议既具备TCP的丢包重传能力，又要具备UDP的高性能，这样QQ可以在保证传输信息的同时又可以维护更多的用户网络连接，在那个年代QQ的单位后台处理能力可能是其他同类产品的10倍以上。

QZone是宽带时代的杰出代表产品。

2013年Facebook的公开数据显示Facebook的日上传照片数为3.5亿张，总照片存储数达2500亿。

今天的QZone日上传照片峰值超过5亿，照片总量达6000亿，和Facebook同一级别。

照片的存储是宽带时代极具挑战的技术难题，它不光是海量存储的问题，而且还有海量访问的问题，因为你的照片不仅仅是你自己访问，你的朋友也会来访问，它带来的性能开销是几十上百倍的。存储的难题除了性能还有成本，极致性能下的极致成本。QZone的后台存储系统是一个在物质介质上重新实现的一套存储系统，它是一个非常有挑战的技术，它对文件系统的inode索引进行重新设计，使得存储系统既能充分地使用磁盘空间，又能很好地管理照片这样的"小文件"。QZone后台存储系统迄今为止在整个后台里面也是领先的。

微信是移动互联网时代的超级APP，它不仅是一款IM，也是一款SNS平台，同时能进行内容分发，还是智慧城市的入口。它不仅能发消息、分享朋友圈，它还能打车、吃饭买单、购物、交水电费，甚至预约看病挂号，超级APP肩负着超级责任。

有数据显示，Amazon的AWS服务宕机持续时间超过40s，上面的服务像Slack、Netfilx、Pinterest等多款APP会出现无法响应等问题。大家还记得去年的天津滨海新区的爆炸吗？在爆炸的中心区域就有我们Wechat的数据中心，那次的事故为什么没有影响到Wechat的稳定运营？因为很快我们把Wechat的服务切到上海、深圳的数据中心去了。因为我们深知Wechat的每次闪断不仅仅是一条消息的延迟到达，不再是查看朋友圈时的缓慢，更重要的是你吃晚饭后结账时的困境，也可能是明天无法及时看病的苦恼。Wechat的后端采用了全球分布、用户就近接入的架构，在数据的一致性，网络的可靠性做出了极多的容错、容灾设计，这种极致架构不仅能应对人祸，还能应对天灾。

信息时代的科技原力是"摩尔定律"，摩尔定律提升了基础网络建设的进程，让我们的互联网产品能快速更新。

到底什么是AI?

2016年是AI起源的Dartmouth会议60周年，人工智能在过往的60年发展中几经沉浮，起起落落，在今年散发出璀璨的光芒。人工智能的兴起是大数据、云计算科学进步的产物，也是人类对未来世界向往的必然。

什么是AI？AI是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。

AI包括：计算机视觉、语音识别、自然语音处理等类似人类的感知、认知智能。

腾讯副总裁姚星：AI Lab现在主要在做的两件事

当下很多人认为AI就是机器学习，或者说是深度学习，这是很狭义的，机器学习是AI的核心算法，确切地说，AI和机器学习的关系是这样的：

AI = A->f(x)->B，机器学习是人类智能行为的一种拟合函数。

目前的AI总体来讲还是一个非常初级的阶段，虽然我们在某些"感知"智能上有些突破。比如我们在计算机视觉上的人脸识别能力，语音识别上的速记能力等垂直领域已经接近或者超过人的平均智能水平，但是这些相对于一个人的综合智能来讲都还是非常狭窄的。

之所以这样，本质上来讲，我觉得还是算法本身还需要更高维的突破，而不是简单的演进。

比如我们针对视觉的AlexNet到VGG再到现在的ResNet，每次算法的演进还只是停留在更深的神经网络、更复杂的神经网络连接的设计上，通过这样复杂的神经网络学习、更多的样本特征来更好的拟合人脑的"感知"。

再比如"认知"智能的自然语言处理，但是面对这种语言序列问题，尽管我们的神经网络从早期的RNN演进到LSTM，再到现在的Attention Model，但至今为止机器还无法完全胜任这种复杂计算。

人的智能是一个非常高的起点，人是经过数十亿年的生物进化，即便是新生儿，从他一出生开始他的智能起点就非常高。比如出生不久人就知道这个时间是三维的，如果我们把东西藏在某个大型物体后面，人的本能就能知道。这是一个非常高的智能起点。人认识新生物也只需要少量样本就能学会，但目前的机器学习并不能做到这样，我们无论设计多么领先的神经网络模型，都需要重新训练数据样本，并且需要大量数据训练样本的训练拟合。目前的机器学习方法我认为是正确的，因为我们学习的不再是表面现象而是深层次的特征。这就犹如人类学习鸟儿飞翔不是仿照鸟一样粘上羽毛来振翅飞翔一样，本质上的飞翔原理是空气动力学和流体动力学。

AI的核心算法如何突破？

AI的核心算法如何突破？如果类比人，我想它需要在这三个方面进行突破——

1、创造力；2、归纳总结能力；3、举一反三能力。

对应到机器学习就是——"强化学习"、"无监督机器学习"以及"迁移机器学习"。

"强化学习"已经通过deepmind在Atari和Alphago上证明了巨大成功，Alphago之所以厉害，是因为通过强化学习自对弈产生了大量的非人类棋局样本，通过这些样本再来进一步学习提高，未来我们需要采用"强化学习"创造更多的数据。

"无监督机器学习"至今为止没有好的"聚类"算法，也就是没有好的归纳总结能力。人类能给表面非因果关系总结出很多原理，如"三点确定一个平面"、"惯性定律"等，这是一个很强的高维抽象能力，未来的无监督机器学习需要在这上面进行突破，通过少量的样本，站在前人基础上的归纳总结。

"举一反三"也是人的一个重要的基本能力，通过学习了"下围棋"，快速地推演到"下象棋"，这需要"迁移机器学习"在模型迁移上的突破。

信息时代的科技原力是摩尔定律，AI时代的科技原力是"算法"，而且这种算法是有如人类进化一样，从"单细胞"到"多细胞"，再到"智能"的演进过程。

AI的未来是什么？我想AI的未来不仅仅是给我们提供更加安全、更加高效、更加便捷的智能工具，而是要帮助我们实现每个人心中的那个"大白"，那个超级英雄，使得我们的小朋友更加地"被理解"，他们不会由于父母的不在身边而缺少陪伴；使得我们的成年人更加的"被保护"，他们不会由于危险的工作而使得自身安全得不到保障；使得我们的老年人更加的"被照顾"，他们不会由于在偏远山区而得不到及时的治疗。无所不在是AI的未来。

从18世纪的第一次工业革命开始，人类的每次进步都源于科技的进步。而当今的互联网时代，从窄带到宽带，从移动互联网，再到当下的AI无不是一浪又一浪的科技变革，这种科技的进步也犹如潮汐一样一次次越来越猛烈的推动着我们进步。

关于腾讯AI Lab

AI Lab现在到底在做什么？

腾讯成立了AI实验室，这是早期的阶段。AI的时代在人类的演进过程中也是早期的，虽然我们对AI有很大的期待，但现在的AI的确是早期。

腾讯AI的使命是立志于要打造一个通用AI，而不仅仅是工具，当然工具也很重要，我们也在做人脸识别、语音识别、聊天的机器人等很多智能硬件，也做了很多产品，但这些只是我们在腾讯AI理想里的一个阶段。腾讯的AI未来是打造出一个更加广义的AI，让真正的AI产品能够深入到我们的生活中去。

AI Lab刚成立不久，AI是大势所趋，也是我们追求未来的另一种结果。AI对基础学科的要求是非常之高的，不仅是应用工程，更多是基础科学，比如对数学、生物学、脑神经科学，包括哲学都有非常多的要求。

刚刚问到AI实验室在做什么，这其实也是处于非常初级的阶段，主要有两件事情：

第一，招聘更多优秀的科学家能到我们AI Lab；
第二，我们更多地想建立基础学科，做底层的研究，不急于做成产品。

现在实验室还是非常早期，打好基础，未来AI的想象空间非常之大。

AI Lab需要大概多长时间能看到成果？

我们没有KPI，搞技术研究也许是人一生奋斗的目标，在这上面提KPI本身就脱离了技术研究的初衷。我们也有很多的目标，腾讯的产品现在就有类似的AI技术。如果我们用过天天P图这款软件，以滤镜为例，怎么把一幅照片变成梵高照，或者抽象艺术派的图片，这就需要用计算机视觉的技术去解决。此外还有微信语音识别转换文本的应用。我们在工作当中一定会把好的东西慢慢提炼出来，去实现在产品上逐步运用。作为真正通用型的AI，我们要为此付出非常长的时间和很大的努力。不急于追求短时间、急功近利的成果，更多是基于长远的考虑。人才对我们来讲很重要，基础算法、基础科学的研究对我们来讲同样重要，产品水到渠成慢慢会出来。

我们对AI就犹如腾讯对整个产业一样，是非常开放的，希望联合大家把AI最终发展应用到人类本身提高生活质量上面来。我想在未来我们会跟行业里，包括国内、国外优秀的AI团队有更多的合作、更多的投资、更多技术上的交流和切磋。

雷峰网原创文章，未经授权禁止转载。详情见转载须知。

2人收藏

小芹菜

编辑

雷锋网编辑，AI慕课学院负责人。关注智能驾驶与金融科技，欢迎来撩：www.mooc.ai。

发私信

当月热门文章