注册

涂子沛:通过数据解决社会问题是未来发展方向


来源:凤凰卫视

人参与 评论

核心提示:涂子沛老师分析说,从数据当中去发现规律,用数据来解决社会问题,这种想法其实有更久的渊源。1830年我们的法国哲学家孔德他就提出社会物理学的概念,他们当时也从数据当中得到一些重要的发现,他们在

我们走到今天不仅仅是一个数据的积累,从进入信息时代之后,我们1946年发明第一台计算机进入信息时代,到现在60多年了,我们其实克服了很多困难,有很多的技术进步,才把我们推动到了今天。我们说第一个是什么,第一个就是1965年提出来的这个摩尔定律,1988年台湾来的普适计算。1989年提出来的数据挖掘,我们说还有2004年出现的这个社交媒体,就这些现象集体地推动,才出现了这个大数据。我们来看看它具体怎么推动的。

1965年的时候呢,英特尔的这个联合创始人摩尔他就发现一个规律,他说一个集成电路,一个芯片上,同一个面积上的晶体管,一到两年这个数量就要增加一倍,现在我们一个微处理器,上面的晶体管大概是几十亿个,就晶体管越做越小,越做越小,当然材料就越来越少,价格越来越低。同一个面积上不停地增加,它的性能就越来越好,导致了一个什么呢,就是这个计算机的性价比不断提高,价钱不断降低,性能反而不断提高。我们比如说硬盘,1955年的时候,IBM推出第一款硬盘的时候,那时候一兆就六千美元,我们说一首歌就几个兆了,那时候保存一首歌要几万美元对吧?我们说到1993年的时候,每兆降低到一美元,到了2010年的时候呢,降到每兆不到一美分了。你说半个世纪的存储器的价格是下降了几百万倍,我们说人类历史上没有一种产品在半个世纪,它的价格能下降几百万倍。大家争论比较多的是说什么?摩尔定律还会不会继续有效?英特尔现在已经发明了三D晶体管对吧?他们已经用事实证明了,他们说摩尔定律到2020年之前,还会继续有效,就是(价格)还会继续下降。

摩尔定律为我们解决一个很重要的问题,它为大数据时代的到来铺平了道路,物理道路,就是再多的数据,再多的信息我可以非常低廉的成本来进行保存。那我们讲第二个因素,普适计算,在1988年的时候,美国的一个科学家叫马克·维瑟提出来的,他说什么呢?1988年互联网刚刚产生,他说人类的计算浪潮可以分为三股,第一股叫做主机时代,主机时代的时候,计算机奇大无比,很多人共用一个计算机。一台计算机就占了半个房间。好到了上个世纪七十年代末的时候,计算机变得很小了,出现了个人电脑,人手一机,但马克·维瑟说这不是时代的终结,时代的终结是计算机会变得很小很小,它会融入到这个物理环境当中去,那你发现都发现不了。我们今天是不是到了这个时代?我们说我们的手机已经是台计算机了,我们如影随行是吧?我们还有RFID这种视频标签对吧已经很小很小,小的像豆子一样。它是可以接收出去,可以发送出去。现在已经很多的应用,我们可以把这种RFID的标签放到垃圾筒里,垃圾筒满了的时候就发出信号对吧,美国的废城他们就实施了一个这样的项目。

涂子沛:社交媒体使大数据时代“一锤定音”

这个收垃圾的人员工作量直线下降,原来几十个人收垃圾,垃圾处理队伍现在变成几个人,无论是摩尔定律还是普适计算,解决的问题都是刚刚主持人说的大容量的问题。大价值的问题一直到1989年我们提出数据挖掘之后才得到解决,1989年的时候,世界计算机协会召开了第一次数据挖掘的年会,标志着数据挖掘开始兴起。我们说数据挖掘是用自动的算法在大量的数据当中得到一些隐藏的关系、模式,总结出新的知识。我们说数据挖掘也是大数据时代大众所津津乐道的话题,其中最经典的例子莫过于某个超市的啤酒和尿布的故事。某个超市在数据当中发现啤酒和尿布它们的销量呈现正相关的关系。为什么是这样呢?经过调查他们发现,母亲在生了孩子之后买尿布的经常是年轻的父亲,他们在买尿布的时候呢,喜欢买点啤酒犒劳自己,那这个就是一个知识。超市利用这个知识把啤酒和尿布捆绑在一起,推动了两个商品的销量,成为了它的竞争性优势。

我们中国也不乏这样的例子,最近华东师范大学有一个报道,我们有一个女生收到了来自校方的一封信,信里面问她你是不是有经济困难?原来是校方的这个数据挖掘系统发现她餐费一直很少,这个女生很感动,但事后发现这是一个美丽的错误,她其实是在减肥。我们教育领域还有一些其他的故事,我们再说美国的威斯康辛州,他们有个学区,他们发现小学生一二年级的小学生经常请假,而且每年请假的这个比率趋向一个恒定,他们就做数据分析。他们发现请假最大的原因就是生病,生病最大的原因是哮喘病。有了这个发现之后,他们在开学新生入学的时候,就组织家长进行哮喘病的防治讲座,这个很见效。接下来一两年呢,这个学生请假的比率呢就明显下降。

我们说在数据当中挖掘出新的知识,数据挖掘给了我们人类使用数据的一个能力,我们说到2004年的时候,我们信息技术上的又一个革命性的现象出现了,社交媒体出现了。我们说社交媒体对人类社会的影响也是革命性的,我们举个例子,2011年的时候,弗吉尼亚发生了地震,但是我们纽约州的居民距离弗吉尼亚吉百利,他们首先在微博上看到弗吉尼亚地震了,弗吉尼亚地震了,几秒钟之后这个震感才传到纽约州。那我们知道现在信息传播的速度比地震波还要快。那这个社交媒体对我们的这个大数据时代有什么意义呢?这个意义是决定性的,为什么这么说?我们这个社交媒体产生之前,我们是软件在收集数据,是感应器在收集数据,但社交媒体产生之后,是全世界的网民都开始贡献数据,而且这部分数据很特别,叫做非结构化数据。我们以前软件收集的数据是有严整结构的。我们今天你发微博,他上开心网,他发的微博有可能有一个视频,你发的可能没有视频,有一个图像,说明它结构是乱的。这部分非结构化的数据,也给我们数据分析、数据挖掘带来最大的挑战,这部分非结构化的数据,同时也叫行为数据。当全世界的网民开始贡献数据的时候,这数据真正开始爆炸了,现在社交网络仅仅产生八年多,但非结构化数据已经占人类数据总量的75%。大家可以想像,所以说社交媒体产生之后,大数据时代就一锤定音了。

解说:伴随着大数据时代的到来,数据计算的内涵都发生了改变。人类将会迎来一个数据爆炸的时代,那么大数据到底是如何改变我们的生活方式?又怎样能够实现社会治理?世纪大讲堂,《大数据生活方式与社会治理》正在播出。

涂子沛:好我们讲到这里,我们再来看看这个大数据的概念,我们现在应该有了一个更深刻的理解,我们说这里有三个等式,大数据等于传统的小数据,加上现在的大信息,视频信息、声频信息、图象信息。那么第二等式是大数据等于非结构化的数据,加上结构化的数据,一个百分之二十五,一个百分之七十五。好,第三个也是最重要的,我们说大数据等于大容量加上大价值,容量是现象,价值才是本质。好,我们有了这种理解之后,我们就知道在这个时代,我们必须转变我们的思维方式,怎么转变呢?我们说原来我们对数据的期待和要求是用数据说话,因为数据代表最精确的事实,最锐利的事实,用数据说话的意思就是用事实说话,但是说在大数据时代这远远不够。我们现在要做的是要在数据当中寻找新的启迪,挖掘新的知识,总结新的规律,这是大数据时代的思维方式。

好,我们对大数据有了更深刻的认识之后,我们随后要问,大数据对我们的生活究竟有什么样的影响?它把我们带到哪里去?我的一个判断是,我们的社会会兴起一个全计算型的社会。首先我们要知道我们刚才讲了数据的内涵发生了改变,因为数据的内涵发生了改变,计算的内涵也发生了改变。我们说计算已经不是我们传统的加减乘除了,我们刚才说数据不仅仅是传统的、有根据的数字,现在文字也是数据、视频也是数据。举个例子说,你想找到凤凰卫视《世纪大讲堂》的视频,你可能上百度输入关键字《世纪大讲堂》进行搜索,你输入的是文字,得出的是视频。这个也是计算,也就是说搜索就是计算。

我们整个社会、整个世界的计算呢可以分为三种,第一种是物理计算,第二种是有生命现象的计算,第三个呢就是社会计算。好,我们先说第一种物理计算,谈到物理计算呢,我们就不得不提到另外一个概念物联网,我们未来是所有的电器、机器都会装上感应器。连上网络,就会让我们的数据呢会有一个更大的爆炸。我们刚刚谈到,当我们的人开始贡献数据的时候,数据爆炸了,当全世界的机器、电器开始贡献数据的时候,将会迎来一个更大的数据爆炸。好我们未来的物联网世界是什么样子,我们来看看这幅图,大家看到飞机,一架飞机上有很多重要的机器,我们说未来的物联网、感应器要装到这些重要的每一个部位的机器上,一架飞机上会有很多的感应器,每一个螺旋桨上都有感应器。然后同一个航空公司的飞机组成一个网络,不同的航空公司,世界上全部的航空公司组成一个集群,全世界的飞机之间、机器之间可以互相通信。

我们再看下面这幅图,被称为这是汽车商的一个工厂,位于纽约州的一个工厂,电池厂,被称为工厂2。0,它的工厂里一万六千平方米,但是装了一万个感应器。这些感应器在对工厂的各个条件进行监测。比如说温度,比如说压力,比如说湿度,比如说在生产的过程中,各种的配料,它的一个口号是什么,是让产品产生记忆。就是一个产品送出去,出了工厂之后,如果它有问题了用户反馈有问题了,我们立刻会查找它当时生长时候的条件,追溯它的数据,去确定它的问题。我们讲了物理计算,我们也提到了生命计算,我们最后要提社会计算。社会计算是大数据时代最大的亮点,因为社会计算,我们的社会治理模式将会发生改变,大家会觉得很奇怪,为什么社会能够计算?我们说社会计算也有很长的、很久远的渊源,我们先从近的说起,我们社交媒体产生之后,我们很多社会科学的研究者发现,通过社交媒体上的数据,我们能够做出很多推断,你能发现一个人的喜好、偏好、观点、意见,那传统的方式我们要发现一个人的意见的时候,要去做问卷调查。例如说美国的总统选举,原来的传统的预测方式谁能当选?我得一个一个去问,选取有代表性的选民进行询问,完成这个调查,但我们能看到,我们上一届选举这种局面已经完全改变了。奥巴马的当选,投票完了之后就有社会科学的研究者分析了微博上的数据、社交网络上的数据,就宣布奥巴马即将当选,最后奥巴马果然胜出。

他们认为基于这种社交媒体的计算,他们称之为社会计算,另外有科学家相信,我们现在数据越来越多,各种数据现象都被记录了。所以呢未来一切社会现象、社会过程、社会问题都可以计算。还有科学家打出比喻说,我们现在的数据就像一个新的显微镜,我们14世纪的时候发现显微镜,这个显微镜我们把它对准了物理世界,这个显微镜的产生使人类的知识开始爆炸。现在我们大数据这个显微镜对准的是人的行为、社会现象,这将引起社会科学知识关于人本身的知识的一个大的爆炸。我们说从数据当中去发现规律,用数据来解决社会问题,这种想法其实有更久的渊源。1830年我们的法国哲学家孔德他就提出社会物理学的概念,他们当时也从数据当中得到一些重要的发现,他们在研究自杀率,他们发现伦敦的自杀率无论是在一个经济箫条的时候还是经济繁荣的时候,自杀率几乎是恒定的。就像有一块铁磁石一样,吸引着去自杀。所以他们就提出社会物理学,他们认为社会就像天体一样,存在规律,怎么去发现这种规律呢,就要用数据去发现。但是受限于当时的条件,数据有限,到了我们这个时代,大数据的时代,所以有更多的学者相信,社会计算一定会兴起,用计算、用数据来解决社会问题,是未来的发展方向。

《世纪大讲堂》节目在凤凰卫视中文台播出【节目专区】
首播:星期六16:15—17:15
重播:星期日08:25—09:20 23:30—00:30

相关新闻:

[责任编辑:昌洪坤]

标签:大数据时代 涂子沛 社会治理

人参与 评论
2014-02-07世纪大讲堂 大数据生活方式与社会治理 http://d.ifengimg.com/w120_h90/y0.ifengimg.com/pmop/2014/02/07/370951c3-61e1-446b-bf6d-b4ec527a2ec0.jpg

网罗天下

凤凰新闻官方微信

0
凤凰新闻 天天有料
分享到: