注册

参与医疗诊断自动驾驶汽车 人工智能将这样改变我们的生活


来源:凤凰卫视

自动播放

核心提要:阿尔法狗大破李世石,特斯拉自动驾驶解放人类。计算机的算力每年指数级增长,算法愈发精妙,通过加入海量数据的深度学习,人工智能超越人类,也许只是时间问题。凤凰卫视4月8日《世纪大讲堂》,以下为文

建立人类思维模式 AI的深度学习算法

王维嘉:人工智能到底是什么东西,为什么我们要用神经网络这样一个词来描述人工智能?其实它简单来讲就是模仿人脑的这样一种工作方式,这张图是一个人脑的突触,大家知道,人的学习和记忆是通过突触的连接,中间这个蓝的这个椭圆形的东西就是我们的神经元,这中间的很多细的线就叫突触。这个学习过程是怎么完成的?比如一个小孩被火烧了一下,这个外界的信号刺激就会让很多神经元的突触,这里头你看有很多点亮的地方,点亮了以后,就和它附近的神经元连接起来了,这种连接一旦成为永久性的连接,就形成了记忆,以后小孩就知道火不能去碰,是热的。好了,这就是人类学习的一个基本的机制,如何我们能够用电子的电路搭出这么一个神经元,很简单,就是下面这样一个东西,我们用一个加法器,然后就可以把输入加在一起,然后乘上一个系数,然后输出到下一层。假如说下边像一个方框的一个东西,我们叫整流器,也就是说我可以用电子元件搭出一个很简单的折算一个神经元。我手里抱的这个黑盒子就是世界上第一个神经元,就是我在斯坦福的导师Bernard Widrow教授做出来的。今天这个神经元仍然在工作,也就是它可以识别很简单的东西,比如说一二三四五六七八九十十个数字它可以识别出来,美国国家博物馆要把这个东西拿走,说我要做历史博物馆内展品,他说不行,我还要上课,因为这个东西还在工作。

什么叫深度学习?这里面每一个圆圈就是我刚才抱那一个盒子,就是一个神经元,用很多很多这样的神经元搭成一个很多层的网络,它就叫深度学习。深度的意思就有很多层的神经元。机器学习的原理很多人讲的很神秘,其实你要真正懂的话,它道理很简单,我这里举一个简单的例子,我们中间这个有很多旋钮这个盒子和我抱那个差不多,就是一台人工智能的机器,我们假设它有很多旋钮。这个人工智能的机器要完成什么事儿,我现在有两种不同的图像,一种是汽车;一种是猫。我的任务就是怎么让这个机器一看知道这个是汽车,那个是猫,我怎么做?第一步我要训练它,怎么训练,我这么训练,我拿一百副汽车的图像给这个机器看,然后我这个输出的地方装两个电灯泡,一个电灯泡对应着汽车,一个电灯泡对应着猫。我希望这个机器做什么,我只要输入汽车的图像的时候,对应汽车那个灯泡就亮了,对应猫那个灯泡是不亮的;我输入猫的图像的时候,只有猫那个灯泡是亮的。好,这是我要达到的不能,但这个机器一开始很笨,它不认识,我输一个机器,结果俩灯都亮了或者是俩灯都不亮,那我怎么办?我就用手去调那些旋钮,一直调到只有一个灯亮,然后每一幅我都这么调。

好了,等到我把这一百幅图像都把它训练好了以后,这个机器就会认识这台汽车了。同样,猫我也这么做一遍。那好了,我在拿第101幅新的汽车,比如说不同的汽车,我一输入,结果对应汽车那个灯亮了,这时候我就说这个人工智能台机器就训练好了,这就是最重要的人工智能机器的训练。训练好了以后,你以后就输,不管什么汽车,不管什么猫,我就对应的灯就会亮,这台机器就说明可以认识汽车,可以认识猫了。当然我举的是一个最简单的例子,你也可以认识一千种不同的图像、一万种不同的图像,人类所有不同的表情、各种各样的语音等等,它实际上是非常复杂,但是背后的原理就这么简单。但是,这台机器的旋钮有多少,今天谷歌和百度做出的人工智能的机器有多少旋钮,一万亿个旋钮,但这么多旋钮我是不可能用手去调的,怎么调,这那里头就有很巧妙的办法,是用一种算法,这种算法叫最陡下降法,最陡下降法什么概念,就是我无非是让它的实处和达到我想要的那个目标值。也就是说,输入汽车的时候,我只希望一个灯亮,对吧,如果这个灯不亮就说明它有错,这个错我就把它变成一个值,这个值画出来以后,就是大家现在看到一个群山的这样一个峰值,我就要在这个群山里头找到一个最低的谷点,我就认为这个机器训练好了。那好了,我这个机器一开始,肯定是在某一个山峰上或者是半山腰上站着,我怎么能找到最低的那个谷点呢?大家可以想象,当你爬山的时候,如果周围是大雾,你根本看不到路,也看不到远处的山,你怎么走到山底?有一个很笨的方法,我围着我站的地方转360度,然后看到一个方向是最陡的,我沿着最陡的方向走一步,然后我再转360度,然后沿着另外一个最走的方向再下一步,我沿着这个笨办法,我虽然什么都看不见,我一定能够下到山底下。前提是不要有悬崖让我摔下去,这里头在数学上不要有悬崖就对应着函数要连续,一定是处处可微分。所以,就用这么一个最笨的方法,叫最走下降法,今天几乎所有的人工智能,不管你是百度的,谷歌的,训练人工智能的方法都是这么训练的。这个数学实际上是一个很古老的数学,两百年前就已经有了,并不奇怪。为什么要很多层的人工智能?它的一个基本假设就是人类的信息,比如说人脸很复杂,表情很复杂,对吧,但是人脸其实可以化约成简单的东西的,比如人脸。我们每个人都是两个眼睛,一个鼻子,对吧?好了,那我就把人脸分解成器官,器官比如我们看眼睛的话,无非就是一些曲线造成的,鼻子就是一些直线造成的。我再把它分成一些线条,我让每一层的神经元只管一个很简单的事儿,第一层神经元,你把人脸上的线条和曲线给我认出来;第二层,你把器官给我认出来,因为你有了线条,一拼就是器官。第三,有了器官一拼就是脸,有了脸一拼就是表情。所以说,所谓的深度学习网络就是每一层学习一个简单的特征,然后直到最后,把复杂的特征拼出来

那么,人工智能这件事情是引起商业界的注意是什么时候?在美国是2012年,2012年发生一件什么事儿,就是美国有一个比赛叫做ImageNet,就是图像的识别比赛,就是拿大家自己编的人工智能的程序来识别图像,看谁的识别准确率。过去二三十年,它的准确率一直在70%左右徘徊,基本上没法增长了,2012年有一个加拿大的博士生他叫Alex,这个Alex就用深度学习的方法来第一次识别图像,一下把准确率从74%变成了84%,第二年就到了88%,到了2015年的时候,出现了一个惊人的变化,就是机器对人脸的识别超过了人的识别率。那这时候就彻底引起了整个全世界的注意。

解说:成功识别小猫、人脸,基于深度学习的图像级别技术在某些情况下甚至比人做的更好,而识别的对象也不仅是小猫,甚至还包括血液中癌症的指标等等。深度学习拓展了人工智能的适用领域,借助深度学习,哪些人工智能将从科幻电影中走出,进入我们的现实生活呢?

王维嘉:今天应用最大的是什么,待会儿我会更仔细地讲就是自动驾驶,自动驾驶这个市场有多大,每年是十万亿美金,因为今天的汽车行业每年就这么大。自动驾驶会彻底颠覆汽车行业,其他的包括图像的识别、语言文字的识别、医疗行业,刚才我们说的家庭医生,还有很多垂直市场。这里头注意我写的一个叫意外,什么叫意外,就是当我们一个新的技术创新出现的时候,大家都在想它的杀手级应用是什么东西,比如说当手机出来的时候,我就和很多互联网的大佬讨论说,你们觉得手机的最后的最重要的应用是什么?他说那我们比如说做搜索的,我就把它的搜索框放在手机上,当我听到这样的回答的时候,我就知道他根本对移动互联网没有理解。他觉得移动的手机就是PC的一个简单的延伸。我们当时也在想,手机的核心的应用和PC最核心的不同是在什么地方?就是它有它的内置信息,最后果不出其然,移动互联的杀手级应用不是过去互联网PC的应用,而是什么,Uber,是滴滴这样的应用,是O2O,因为它全部和你的位置相联系。我们今天说的自动驾驶也好、图像识别也好,很可能它并不是人工智能杀手级应用,今天它的杀手级应用我们每个人都不知道是什么。

一旦这种谷歌的开源社区形成全世界的用户最多,它就是不可撼动的,就成了一个赢家通吃。那简单来讲,特斯拉就是四个轮子装了几个沙发,再装一个平板电脑,它已经不是一部带智能的汽车,而是一个四个轮子的电脑。

网络片段:我用这个自编应用跟Jarvis对话,它通过人工智能理解我的话,再衣令行事。

解说:哄小孩。

网络片段:早上好。

解说:教中文,叠衣服,把来访的朋友请进家门。

网络片段:Mark,你爸妈进来了。

解说:Jarvis而看起来真是个不错的管家,它也是facebook CEO扎克伯格在2016年初按照惯例给自己定下的新挑战目标,像钢铁侠那样拥有一个智能的家。

网络片段:这里包含我无法量化的元素。

解说:正如以往的每一次科学创新革命一样,这一次人工智能技术的核心仍然是在硅谷,为何创新飓风总是从硅谷刮起,这场未来科技大战,中美双方的实力对比又是怎样的呢?《世纪大讲堂》精彩继续。

王维嘉:什么叫开源的软件平台?就是今天大家可能会听到谷歌有一个东西叫Tensorflow,脸书有个东西叫Caffe。像这样的东西简单来讲就是我如果是一个软件工程师,我想用人工智能,但是我对刚才说的那些什么最陡下降法、下坡法也搞不明白,但是我也想做。我怎么办?就是谷歌这样的公司就把那些底层很复杂的东西打成一个一个包,弄成一个一个模拟,你到时候写程序的时候调用这些模块就可以了,你不需要懂更细的细节。那么,这样一个东西就是今天所谓的一个叫人工智能的编程框架,这种编程框架今天有一个很重要的特点,它全部是开源的。就是说我这是一个社区,每个人编的程序必须免费地提供给所有其他人用,开源这件事儿为什么在美国有这样一个文化呢?它主要和这个国家的历史有关系。也就是美国这个国家它是从底下一点点做起来的,自治的小镇加起来变成一个州,这13个州就变成了每该的新英格兰,就变成了后来的美利坚合众国。也就是美国这个国家是自治的,就是每一个城市是自治的,为什么现在比如说川普当了总统,很多州可以把他的禁穆令给否定掉了,因为他管不了各州。州长管不了市长,市长管不了一个镇的镇长,因为大家都是自己选出来的。在这样一种基础的文化,像互联网这样一个多中心的或者无中心的,开源的文化它是一个很自然地和文化契合的一个东西。所谓开源是什么,就是咱们这些热爱这件事儿的人一起,自己组织自己,把这件事儿做好,不需要什么领导。这次咱人工智能也是一样,开源社区,现在有很多不同的社区,但是这些大公司为什么愿意开源,它也希望未来的所有的开发人员都在他的平台上进行开发,这样他就形成了一个不可撼动的生态。很多人问我说,你觉得中国和美国的人工智能区别在哪里?我说今天当然差别很大,但中国永远可以赶得上,因为中国有很多很聪明的人。但是,这个生态系统是很难赶上的,就像操作系统,中国出了很多中国操作系统,红旗Linux,当你的操作系统出来的时候,它最后都失败了,失败原因在哪里,没有一个软件工程师愿意在这个操作系统上花时间为它开发应用。因为我做一个软件工程师,做应用的,我脑子想什么,我怎么赚钱。比如微软操作系统现在全世界有十亿台,我写一个应用十亿人用,一个人给我一块钱,我就是十亿美元,对吧?如果一个红旗Linux现在只有十万个人用,那我只能赚十万块钱,对于一个开发工程师来讲,他最最重要的就是你这样一个平台有多少用户,所以一旦这种谷歌的Tensorflow形成全世界的用户最多,它就是不可撼动的,就成了一个赢家通吃。所以未来我觉得中国的差距和挑战最大的是在这样的生态系统的差别上。

解说:如果说机器猫、大白、钢铁侠的智能管家,这些人工智能的超强应用还没那么快能走出科幻电影,又一项应用可以说很快就会进入我们的生活了。那就是自动驾驶。据国外媒体报道,在硅谷的街道上自动驾驶汽车已经是司空见惯,而我们的嘉宾王维嘉也是敢于第一个吃螃蟹的,自动驾驶汽车车主。接下来,他将给我们详解硝烟正起的自动驾驶技术大战。

 

[责任编辑:刘家豪 PV089]

责任编辑:刘家豪 PV089

  • 好文
  • 钦佩
  • 喜欢
  • 泪奔
  • 可爱
  • 思考
地平线上的飓风中心——人工智能(上) http://p0.ifengimg.com/pmop/2017/04/08/28b115a5-6048-45b3-8987-067658e41c06.jpg

凤凰卫视官方微信

凤凰新闻 天天有料
分享到: