李开复：为什么今天是人工智能的黄金时代

发表: 2017-04-20 浏览: 1489

人工智能深度学习

最近人工智能成为全球热门新闻话题，很多是因为大家看到 AlphaGo 在几个月前击败了李世石，最近在网上还传出年底之前它要挑战柯杰的消息。但在这个新闻的热度之下，有一点让我觉得很可惜：大家对这个话题讨论的重心都放在了人工智能是不是在模仿人脑，“奇点” 是否即将来临这样的问题上，却没有真正关注人工智能对我们的现实影响。

“奇点” 认为未来机器将有各种的智能、人类必须做一些事情来保护自己。我们在座的没有任何一个人能够证明或否定 “奇点”，但就我个人而言，我认为人工智能要取代人还是一个非常遥远的事情。我觉得我们需要更关注的事情是人工智能是今天能够拿来用的工具，它能帮助人类解决问题，能取代重复性的工作，能创造商业价值。正因为这个理由，我认为我们今天进入了人工智能的黄金时代。

随便举几个例子：今天很多的工作以后大部分都会消失，比如说翻译，虽然现在还不是做的那么完美，但是每年进步的都很快，再过几年人工的翻译可能就会非常难找到工作了。记者也同样如此，如今 90%美联社的文章都是用机器来写的。几乎所有思考模式可以被理性推算的工作岗位，在有足够数据支撑的时候，都会被取代。有人说十年之内一半的工作会消失，有人说十五年之内一半的工作会消失，我觉得这些都是合理的揣测。

我想在座大部分都会相信这个理论，而如果你对此还有怀疑，你可以想想，为什么 AlphaGo 这么厉害？就是因为它可以动用到几千台机器每天和自己对弈上万盘的围棋，而这人是做不到的；以后为什么自动驾驶会这么厉害呢？因为它可以用它的各种的 sensor 在路上搜集数据，这不是任何一个司机可以匹敌的。所以这些都是一些必然的过程。
何为人工智能

到底什么是人工智能呢？我觉得大概来说可能是有几个部分。

首先是感知，感知就是包括视觉、语音、语言；然后是决策，刚刚讲的做一些预测，做一些判断，这些是决策层面的；那当然如果你要做一套完整的系统，就像机器人或是自动驾驶，它会需要一个反馈。

再从博弈、感知决策以及反馈四个方面回顾一下人工智能的发展历程。博弈今天就不讲太多了，但是基本上我可以看到从我在大学做的 Othello 到 Checkers 再到 DeepBlue chess，经过很长的一段时间，终于有了今天 AlphaGo 打败了围棋世界冠军。我们从中可以看到，这是一条长达三十多年的路程。

在感知方面，从我的博士论文发表到 Nuance 成为一个顶尖的公司，从中国诞生了科大讯飞到美国的 Deep Face、中国的 Face++ 等等做得越来越好的企业，这些年也有很多的进步。还有一些很特殊的例子，比如最近看到一些搞笑的比较 Microsoft Tay 在 Twitter 上开始跟人家交流一下子就讲了一堆不堪的话，就被 Microsoft 撤回了，所以这里有很多的成功例子，也有很多有趣的事件。

决策方面，从早期 Microsoft Office 里的工具到 Google 广告的推荐，然后到金融行业的很多智能决策公司的出现，进步迅速。Google auto mail 可能大家还没有看过，但是如果你现在还在用 gamil 的话，会发现你有时候收到 email，Google 会跳出来问要不要发回复，有时候它连回复都帮你写好了，而且写的很精确。这也是人工智能的体现。可能以后我们讲话都不用，助理能帮我们搞定，人工智能的助理肯定也是一个方向。

最后是反馈，从 CMU Boss 早期的无人驾驶到 Amazon 用 Kiva 推动物流，再到最近的 Pepper、Google car，我们可以看到这个领域过去三四年特别的热，有很多看起来商业化已经做的非常好。

科普深度学习

在这里，我要稍微深度讲一下深度学习。

深度学习是一种神经网络，与但与之前的相比，它的特点是使用了多层网络，能够学习抽象概念，同时融入自我学习，而且收敛相对快速。收敛快速可能是一种技巧，不见得是一个理论，但是有一批人通过它解决了很多重要的问题。

简单的来说，如果我们有很多笑脸，然后我们把笑脸的像素输入到一个神经网络里面去，最后你那儿希望让机器能识别这是姚明，那是马云，但是因为你这个深度学习的网络很深，要一次性学会这么多也会比较困难，所以就需要用到一个比较快速收敛的技巧——自我学习。通过自我学习，机器会逐步从大量的样本中逐层抽象出相关的概念，然后做出理解，最终做出判断和决策。

比如它可以有好几层的 nodes 和 connection，经过这些 nodes 和 connection，它在每一个层次会感知到不同的抽象特征，且一层比一层更为高级。这些都是通过自我学习实现的，而不是人教的。经过自我学习，从一个脸输进去再从同样的一个脸输出来，它就从里面抽象的学习到了一个人的脸重要特征。

经过这个学习之后，我再去做监督训练，看机器是否能够识别他们，如果不能，就在训练之后做微调。例如，如果我输入了马云的脸，出来的却是王宝强，那训练系统就会告诉你的网络说这个是错误的：这不是王宝强，这是马云。那接下来就是要进行微调，以便于下一次机器看到这个脸时，能识别出是马云的概率高一些，出来王宝强的概率低一些。

但是这么一调也不能调的太过火了，要不然就会有 overtraining 的问题，我们就对整个数学公式做一点微调，用大量的数据，不断重复的去教它，经过不断微调，那么它就很可能在多次之后降低识别错误。

其实这一整套理论在二三十年前就已经有了，我在做我博士论文的时候，很多我的同事就在做训练神经网络的工作。

深度学习在最初的时候训练速度特别特别慢，所以比较难进入工业级别或者是应用级别，比如，你的手机是做不来这个的，因为它的速度实在太慢了。但经过这么多年，我们的计算机变的越来越快，另外也有了更多取巧的训练和识别做法，深度学习的应用可能性也发生了变化，它能被应用的领域越来越宽。多年前，我过早的进入了这一领域，但是现在，人工智能大规模应用的时机已经到了。

凭什么这么说？一个很简单的评估标准就是，我们的深度学习或者是任何的机器学习，它是不是超越人类的能力表现，如果超越的话，可能很多应用就会产生。比如在机场，如果机器识别人脸的准确度超过人，那么我们那些边防的人就可能不需要那么多。这并不是说机器不会犯错，而是说既然人不能比机器做的更好，那我不妨就用机器取代。

深度学习的应用领域

在过去的五年，深度学习的准确度从 75%多提升到了 97%左右，而人的表现准确率大概是 95%。从 95%到 97%听起来只进步了 2%，但实际上是把错误率降低了 40%，这是很大的进步。如果这种进步持续，未来人工智能必然会超过人类的表现，同时也将可以进入一些可应用的领域。这就是今天我讲人工智能进入黄金时代的证据：在很多领域，也包括我们在 face++ 做的人脸识别，包括了 Apple、Google，科大讯飞的语音识别，它们的认知水平将在未来几年的时间内超过人类，而一旦超过人类，应用就会快速的增加。

深度学习首先可以应用于识别，包括人脸识别和语音识别等，这些可以用于安防，安检等。

人脸语音的数据来之不易，但是 BI，商业的流程、互联网的数据却非常丰富。Google、百度很早就已经在搜索，在广告以及推荐系统里面充分使用了类机器学习技术，解决该推荐什么商品，一个商品怎么定价，在什么位置会卖的最多，应该把这样的产品卖给谁等问题。这一类的推销可以直接产生经济价值，而社交媒体营销，整个互联网广告，这每一个领域都是几十亿，几百亿甚至更大的市场。

将智能用于炒股其实也是一个不错的选择。在国内在国外，很多人都在做这方面创业的工作。利用智能，我可以随时来算一篮子股票和期货应该如何对冲，以寻求最大的利润。顶尖金融分析师也会做这个，但是他不可能把所有的股票的排列组合都考虑一遍，但是机器可以二十四小时不睡觉，每天都在算怎么能赚最多的钱。除此之外，deep learning 深度学习的技术可以把各种的因素都融合进来，比如这个公司的高管有没有变动，今天出了什么新闻，行业里还有没有什么变动……甚至你可以对一个智能系统说如果明天巴西发生了地震，什么股票该被购买，甚至你可以说发生了地震不要问我，你直接去买它就可以了。

银行保险方面，比如说贷款该不该审批，则无论是银行的贷款，还是 P2P 的贷款，都可以通过机器来判断，而且数据未必要来自银行内部。

医学方面，因为我自己生过病，也深深的受过这方面的痛苦，我也感觉到在今天的医生的判断真的不是最完善的。一方面医生有好有坏，顶尖的医生是非常少的；第二方面比如在癌症方面，它每一年都有新的药出来，那每个医生每天忙着看病人，就不见得有时间去研究这些药物，那些药物也不是每个国家都可以使用的。还有就是每一个人，他的各种特质，不见得就适合用这个药。这些其实都是可以用机器学习来做出来的。

前一阵我在美国碰到了一些科学家，他们正在用机器学习的方法来发明新药。我们的科学研究方面当然要有聪明的头脑和很好的实验，但是其中有一个很关键的部分，就要是一定的程度去排列组合：试很多东西，对小白鼠先试试这个有没有用，再试试看那个有没有用，然后再在猿猴身上实验，再进行人体实验。在以前，这整个过程都是由人脑完成，但是这个交给机器来做也许会更精准。甚至有一家公司它养了非常多的白老鼠，他里面所有的实验都是通过机器学习精准进行：每天白老鼠活了几只，死了几只，什么药可以进到下一步……这些都是靠机器学习加上非常精密的系统来做。

我们发明的很多新的材料，都不是靠纯粹的科学方法推出来的，也是去试一试，把这个碰到那个，就产生了有很特殊效应的材料。这些知识都可以输入我们的信息学习系统，通过它我们可以帮助发明新的事物。

在教育方面也有应用。在学习的过程中，如果基础没有打好，下一个层次根本学不下去。智能化的教育系统会识别你的学习水平，然后根据你的水平确定学习内容。比如，你的乘法没有学好，机器就不可能让你去学除法。

当然学习外语也是很好的例子，我们今天的语音识别做的这么好，为什么我们学外语还是一定要找外教，为什么语音识别不能再上一层楼呢？所以，当你的技术一提高了，语音识别应用就不会只是我的讲话进去然后文字出来，它还有可能用在教育领域。

在这么多机会之下，这个人工智能会重塑亿万级别的领域。当然这个不是明天就会发生，因为我觉得人工智能在很多方面还是相当大的欠缺。

0 个评论

要回复文章请先登录或注册