2
雷锋网按:六十年前初识计算机的时候,人们就在想:是否有一天我们可以创造出一种人工智能,达到甚至超越我们人类的智能水平。
几十年过去了,AI 经过了几个寒冬。我们仍然没有了却几十年前的心愿。今天,人工智能再一次火爆全球,我们似乎看到了人类科学正在加速冲向那个奇点。产业界和学术界都在不遗余力地进行 AI 研究,甚至流行的美剧《西部世界》也在讨论人工智能。
站在今天的时点上,人工智能到底有什么突破,未来的人工智能会向什么方向前进呢?
四位人工智能界的泰斗大牛在未来论坛2017年会的圆桌对话上发表了自己的看法。
他们分别是:
李飞飞 美国斯坦福大学计算机科学系终身教授、人工智能实验室主任
李凯 普林斯顿大学 Paul & Marcia Wythes 讲席教授,美国工程院院士,未来论坛科学委员会委员
沈向洋 微软全球执行副总裁,微软人工智能及微软研究事业部负责人,未来论坛理事
张钹 清华大学计算机系教授、中国科学院院士、清华大学智能技术与系统国家重点实验室学术委员会名誉主任
【画面从左至右分别为:主持人洪小文、李飞飞、李凯、沈向洋、张钹】
雷锋网在第一时间记录整理了四位大牛的精彩发言。他们似如山巅上的先知,通过他们的预言,似乎可以窥见人工智能的下一个春天。
---
Part1:对于目前人工智能的理解
---
大家都说人工智能可以做很多事情,我想先说说人工智能目前还不能做什么。
人工智能学科从创立到现在,只往前走了两步。
以前人工智能只是建立在数学模型的基础上。而推理模型在数学模型的基础上,把问题变成:如果可以把这个问题清晰地表述出来,用陈述性或过程性的语言,那么计算机就能解决它。
当这个模型被提出来,人工智能解决问题的能力提高了一大步。这样,可解的问题就远比用数学表达的问题多得多。
实际上,当时对人工智能的估计过高。因为人们发现,能“清楚表达”的问题很少。及时是理性思考,有很多问题都不能表述。
这又让人工智能向前迈了一步,而且这一步比前一步大得多。
之前,我们可以用计算机解决的问题是“知其然又知其所以然”的问题。而有了深度学习,我们也可以解决“知其然而不知其所以然”的问题。特别是可以解决感知、视觉、听觉等方面的问题,例如:张三长什么样子,这个实在是不好表述。
我们身边充满“说不清道不明”的问题,用新的深度学习技术可以解决很多这类问题。但是,我们的人工智能还没有到顶峰。
目前的人工智能有三个限制条件。
1、确定性
2、完全的知识和信息
3、封闭化、特定化的问题
一个典型的人工智能可以解决的问题就是:阿法狗下围棋。
围棋有着确定的规则和目标;
对方如何下子,盘面的信息,完全可以知道;
而所有答案的可能性是一个封闭的。
处理带有这三个限制条件的问题,计算机肯定比人类好。但是如果缺一个条件,计算机就非常难完成了。例如打桥牌,答案不是封闭的,计算机就很难做了。
一年以前,如果我和微软小冰聊天。我说我叫张钹,小冰就会傻眼了。因为他没有我的信息。我如果说我是章子怡,小冰应该可以聊下去。所以,尽管小冰很厉害,但是和人的智能还是差得多。
深度学习目前有两个很难克服的重要缺点:
1、鲁棒性差。机器学习过的内容,和没学习过的内容,在识别效果方面差距太大。例如一个模式识别系统,经过训练可以很好地识别马、牛、羊。你给它一块石头,它有可能认为是马。
2、机器数据输入和输出结果差距太大。人的智能是举一反三,而机器是举一百反一。给几百万的数据,识别几万个目标。这和人类是背道而驰的。
所以,现在的人工智能还有很长的路要走。
很多朋友都知道我刚刚生了我们家的老二,还不到一岁大。
作为人工智能研究者,我很高兴能体会当妈妈的感觉。之前张钹老师说感知代表了很多“不知其所以然”的问题,在现在大规模数据标注的情况下,都可以解决。
我觉得人工智能的下一步应该是认知。
认知包括很多我们还不太清楚怎么用数学和人工智能表达的。比如:知识系统的建立、情感的产生和交流、好奇心和创造力驱动的学习,还有 learning to learn。这些都是认知的范畴。
确实,我们人工智能又迎来了春天,但下面确实还有很长的路要走。
我认为下一步人工智能的发展,需要加强对情感,情绪的了解,要走进认知学,心理学。我说的不仅是脑科学,而是认知学。因为我们目前对人的情感理解非常少,而这对于人工智能来说是很重要的。
作为人工智能学者,能够得到这么多关注,我很高兴。但是我也担心这样的“泡沫”会带来什么。如果是更多的机会和研发投入,当然是好事;如果是过度承诺或者不切实际的产品研究工作,可能会对这个领域有些不好的影响。
我参加过很多论坛,大家都在问:人工智能什么时候能超过人?一般专家都会推断通用人工智能超过人的时间,一定在他去世之后的某个时点,例如:五十年后。到了要验证正确与否的时候,他已经不在了,也就不会有人追究他了。(笑)
但人们提出这个问题的时候,有一个假设条件,那就是:假定人自身的智能不再往前走了。
但是,实际上人的智能还是往前发展的。如果现在我们对人的大脑有了新的了解,就可以很快帮助我们提高自己的智能。而人堆大脑的了解,也可以帮助提高人工智能的水平。
深度学习,实际上是把我们对人脑神经网络非常简单的理解变成算法。然后加之以数据,发现智能效果很好。但是,这些人脑神经的只是都是三四十年以前的知识。而我们在期待脑科学有新的突破,这些新的知识一定可以推进人工智能的一大步。所以说,智能这条路是很长很长的。无论对于机器,还是对人。
我在工业界工作,对人工智能的发展还是持非常乐观的态度的。
虽然张钹老师讲人工智能存在种种问题,但是我们现在有数据,有新的算法。我很相信,
五年之内,语音识别技术一定可以超过人;
十年之内,机器视觉一定比人好。
可以据此我们可以想象未来是怎样的图景。
站在今天来看,我们所有的商业应用都被颠覆了。从销售市场,到人事招聘,到用户服务,所有的商业环节都被 AI 改变了,所以从商业角度来看,我看到的是更多的机会。
---
Part2:这次人工智能的复兴,要感谢深度学习和大数据。那么,深度学习到底是什么,未来可以看到它怎样的发展?为了人工智能的终极目标,除了深度学习意外,我们还需要哪些其他的研究方向?
---
五十年后的事情可能我说不清楚,但是我可以说说三五年之后的事情。很多人说究竟现在是人工智能的春天还是夏天?有人说春天,因为正在蓬勃发展。有人说夏天,因为有点热过头了。
但是我说现在是人工智能的秋天。秋天有两个含义。
人工智能现在有果实可摘。为什么我觉得很乐观?因为我觉得人工智能所需的三个资源都是无限的。
1、大数据
2、算法
3、计算力
未来相当一部分人都会往这个方向去做,会在包括语音、图像方面取得很好的成果。
做科学研究,我们要知道冬天要来了。这意味着我们要考虑下一个春天要播种什么种子。也就是说,后深度学习时代,我们要搞什么事。
说到脑科学。人脑有很多层次。其中的智能分布还有大量内容我们并不了解,这些从顶下下,侧向连接等等模式,我们都还不了解。
目前,我们对脑科学只学了一点,就有了这么多成果。如果我们研究更多,一定会有更多的成果。基于对人脑的深度研究,结合神经科学和脑科学,我们要发展新的计算模型。
这两个能力对于现在的人工智能是很重要的。现在为止驱动人工智能就有两招:数据驱动和知识驱动。下面的发展就要把两招结合起来。特别是自然语言处理,离不开知识驱动,只靠数据是不够的。
如果这两个能做好,人工智能就会迎来下一个春天。
说到深度学习,“深度学习”大概在2006年被提出来,但是在2006年之前,“神经网络”这个概念已经存在了二三十年。神经网络领域里,很重要的里程碑是back-propagation。在九十年代,计算机视觉方面做出了 Convolutinal neuron networks,今年的 Deeplearning 基本是这个结构。
现在大部分成功的深度学习是神经网络是有监督学习。有完全的数据标注以后做的。
很多人都在思考如何做无监督的学习,之前也有很多工具。深度学习革命性的一点是取代了对特征的加工。像之前的 SVM,都是“Engineering Feature”,而深度学习是直接学习数据。
深度学习不操作数据本身,而是对结构本身进行操作。这就造成了一种感受,深度学习本身结构太复杂了,例如152层,1001层。这里有巨大的空间,可以突破结构的层面。我认同张钹老师说的,数据和知识的结合。
现在我们的 AI 都是用逻辑的方法来判断情感。因为逻辑代表 IQ,而情感代表 EQ。人类的情感是非常丰富的。未来,从情绪到情感,最是人工智能未来前进的方向。
任何工作都有近期和远期。近期人工智能的发展,我很认同李飞飞讲的,和深度学习有关。机器学习和以前的专家系统有一个非常不同的地方。专家系统是用软件把人的知识写到系统里。机器学习输入的是算法+知识,输出的是程序。
我和李飞飞和做的时候,我们两个是比较另类的的研究者。大多数人在算法上做,我们觉得应该发展知识。知识就相当于上学的时候的教科书。总要有人写教科书。如果没有人写教科书的话,学习方法再好,老师再好,你学的是一年级的教科书,也不可能成为博士。所以我觉得很多领域都需要有人写教科书。
学术界很多人的目标不是产生巨大的贡献和影响力。需要写很多文章,这样可以拿到很多资金。我们做的时候没有资金——申请的时候被拒绝了。
近期人工智能要想发展,一定需要有人做知识的积累和总结。
长远来看,我认同两位的意见,对人的大脑,人的智力是怎么工作的,要有更多的了解。这样才会帮助整个 AI 向前走。
我很赞同各位的说法。在商业上,接下来三五年毫无疑问 AI 可以帮助我们解决很多问题。但是秋天过了,冬天我们要做什么呢?
我觉得有两点。
第一点,我觉得数据很多、算法互通,确实是取之不尽的。但是在计算能力这件事上,我们应该更加重视。几十年下来的摩尔定律,让我们可以把人工智能做到了今天,这是非常了不起的飞速增长的五十年。但是工业界普遍会认为,计算能力会慢慢降下来。这也是大家为什么都在非常认真地去做量子计算,也要到十年、十五年才能看到突破。
今天我们 AI 向前走必须要考虑的问题是:计算能力的瓶颈。
第二点,我们要考虑为什么做 AI。是不是计算能力的增强,就一定会产生智能。从人脑的结构来看,我们应该定义一个小目标:利用符号学和深度学习做一些结合,希望在脑科学和人工智能结合上,解决几个了不起的问题。我自己想要解决三个和人脑息息相关的病。
儿童孤独症
中年忧郁症
老年痴呆症
人工智能如果能解决这三个问题,就是相当了不起的成就。
有关计算能力方面我想做一下补充。
同样的一个题目,在我们脑里解决一点不费劲,为什么在计算机里面就要这么多的计算资源来弄?我们要思考的是这个问题,而不是拼命加快计算机。
我觉得,正是因为我们过去走的这条路,迫使我们必须加快计算力。我的观点是,我们过去做的计算机,从空间结构来讲是最简单的,冯·诺依曼结构。而大脑的空间结构最复杂。你想用一个空间结构最简单的东西去做空间结构复杂的工作,它花去的代价就是计算时间的增加。世界上没有免费的午餐。
过去我们使用大量的计算时间来换取同样的结果,现在能不能改变思路。把计算机做一下改变,例如 IBM 公司正在做,让神经网络的复杂度提高,换来能耗和时间的降低。
至于量子计算,我觉得不要指望,量子计算不可能代替现在的计算机。我们要在现在的计算机基础上进行改造,也就是研究是不是能够加快计算机的运行。
更多人工智能内容,请关注雷锋网。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。