大数据时代预言家:互联网将把人类带向何处 行业资讯
1994年4月,中国最早的国际互联网络诞生,该年也成为中国互联网元年。
21年过去,中国互联网的发展超乎了当年所有人的想象。在信息和数据引领的互联网时代,无论在中国还是世界其他地方,我们历经数载,真的已然掌握了互联网精髓?人类将如何继续发展互联网,还是说,互联网将把人类带向何处?
第二届世界互联网大会昨天在乌镇揭幕,本报独家专访了《大数据时代》的联合作者之一、被誉为“大数据时代预言家”的英国牛津大学网络学院互联网研究所教授维克托·迈尔-舍恩伯格。在长期研究互联网治理与监管的他眼中,网络时代相比人类漫长的历史只是沧海一粟。对于互联网将如何深刻变革人类的经济与社会,我们依旧知之甚少。
没有任何一种科技会绑架我们
“互联网通过给计算机添加通信功能而改变了世界,但多年过去,很多人仍以为互联网只是让沟通变快了些。”迈尔-舍恩伯格说,在研究中他经常发现,在各个行业里,都存在仍旧只把互联网当做与客户快速交流工具的人,并且这样想的人迄今仍不在少数。
但是,这些人无疑是错了。“如果继续这样认为,那么不出几年,这些人就会被市场淘汰。”迈尔-舍恩伯格给出的原因很简单:今天,互联网影响力已经彻底覆盖我们的生活。
既然能耐已经强大到可以无处不在,那么问题就来了——互联网是否已经彻底绑架了我们的生活?随处可见的“低头族”似乎就是最好例证。
不过,迈尔-舍恩伯格表示,这又是人们对互联网的误解,他并不认为人类会对互联网存在过度的依赖。
“没有任何一种科技会绑架我们,只要我们愿意,我们永远是未来的掌控者。”鉴于此,迈尔-舍恩伯格希望人类未来能更加关注事实和数据,用此二者来为经济社会发展做出更好的决策。
事实上,迈尔-舍恩伯格也认同,互联网横空出世后很长一段时间里,都只是一项崭新的技术,并没有“灵魂”,也没有所谓的“互联网精神”。但当“智能”、“数据”等概念逐渐脱颖而出时,互联网的运用也脱离了单纯的技术意义,上升到了新的境界。
大数据究竟是什么
谈到“大数据”,对于这个经常与“互联网”一起打包出现的名词,迈尔-舍恩伯格开门见山地表示,人们对大数据也存在不少误解,最大误解就是“大数据只是一项新技术”。如果用传统的观念去理解大数据,我们不仅会错失大数据自身具备的深刻洞见和巨大优势,甚至会对大数据的分析结果产生错误的理解。
那么大数据究竟是什么?
在迈尔-舍恩伯格与肯尼思·库克耶(《经济学人》数据编辑)共同撰写的《大数据时代》中,他们二人指出,大数据并非某一个确切的概念。最初,大数据的出现是由于某些需要处理的信息量过大,超越了一般计算机在处理数据时能够使用的内存量,因而工程师们必须改进数据处理工具,新处理技术也就孕育而生。
由于互联网公司有能力搜集大量有价值的数据,且背后有强大的利益驱动,所以互联网公司顺理成章地最先成为了最新数据处理技术的使用者。正因如此,很多人担心,掌握了大量数据的互联网公司是否会用现有数据解析其他个人信息,达成某些我们想象不到的商业目的。
迈尔-舍恩伯格表示,据他了解,的确有公司存在滥用数据分析的现象。这也是为何他非常强调通过立法来监管个人信息的使用尤为重要。他表示,一些数据只有在监管严格的情况下才能够被允许使用,而通过法律途径监管数据,远比直接限制或叫停数据流要好得多。
“试想一下,如果能通过分析我的健康数据,为我生病的孩子找到致病成因和治疗方法,这或许是所有人都喜闻乐见的。然而,如果是利用我的健康数据来蓄意提高我的医疗保险成本,这是我要拒绝的。”
他认为,大数据本身并没有错,错误的是使用方法。当互联网的能量愈发强大,我们也就必须更加努力地去避免被诱惑,更敏锐地发现它的美中不足。
人类对于互联网的误读,也部分源自对人类自身的不了解。
任何垄断永远都只是暂时的
虽然迈尔-舍恩伯格认为互联网不会绑架人们的生活,但是互联网“杀掉”了人们更多的时间却是事实。有调查数据显示,BAT(百度、阿里巴巴、腾讯)在中国整个网民的覆盖率里面占到了90%以上,这三家所有APP的时长,加起来占到整个网民消耗时长的50%。
对此,迈尔-舍恩伯格表示:“这种情况在哪儿都一样。”在美国,人们一样每天会有无数时间花在脸书和谷歌上,包括在Youtube(2006年被谷歌收购)长时间观看视频。
“我们唯一需要关心的应该是,会否有下一个百度、阿里巴巴、腾讯诞生。”在任何由创新驱动的行业里,都会出现垄断。但正是因为创新层出不穷,任何垄断永远都只是暂时的。
在美国,许多著名的互联网公司都曾被认为是垄断,但如今他们中的许多影响力都不复以往。
以谷歌街景服务为例,谷歌的图像采集车在许多国家采集了道路和房屋的影像,以及很多备受争议的数据。在一些国家,业主们不希望自家房屋或是花园出现在谷歌街景的影像中,于是谷歌迫不得已,顶着巨大压力,将这些业主的房屋或是花园做了影像模糊处理。但问题是,对于意图犯罪的盗贼来说,这样的马赛克,无异于此地无银三百两。
但是,如果其他公司有一项技术,能同时具备街景的实用,并符合所有人的安全考量,那么谷歌的地位就势必受到挑战——只是,暂时大家还不知晓是否有这样的技术存在。垄断与创新的关系,就是后者对前者的制约。
“只要垄断是暂时的,且创新机遇一直存在,人们就无需担心互联网会发生垄断。”
互联网创业“进场费”远低于以往
2012年撰写《大数据时代》时,迈尔-舍恩伯格和库克耶就提出,如今信息技术变革的重点应该在于信息本身,而不能像过去那样只关注技术。虽然大部分技术专家都认同数据的发展与计算机科技的变革是步调一致的,但今天,好的内容传递已经成为变革真正的推动力。
迈尔-舍恩伯格表示,现在是互联网创业、数据创业的好时代,尤其是在中国。他认为,在BAT三足鼎立的中国互联网格局中,年轻的互联网创业者最需要的就是坚持创新力,有自己的好点子。
事实上,一百年前人们若想创业,需要募集很久的资金才能建造一座工厂。甚至就在十年前,互联网创业者仍需融资多时才能建立一座服务器农场。“然而,今天在大数据时代,创业者需要具备的可能仅仅只是‘一个棒主意’。”迈尔-舍恩伯格说,剩下的创业需求都能以商品价格获得,比如云计算服务。
“也就是说,互联网创业的‘进场费’,在资本层面远低于以往,但对创业内容——‘金点子’的质量要求却不断提高。”迈尔-舍恩伯格表示,这样的现象“简直太好了”。
对于中国目前最炙手可热的“互联网+”,迈尔-舍恩伯格认为这是让数据大显身手的绝佳策略。
他认为,‘互联网+’的思维将任何想得到的事物都尝试与互联网发生联系,这不仅让数据有机会在更广阔的空间发挥作用,对数据搜集来说,也能接触更为多样、广泛的数据源。他说,自己并不认为中国的互联网产业发展过快,更不觉得中国的互联网发展不稳定。“如果真的有什么需要注意,那就是继续保有创新力。”
中国举办世界互联网大会今年已至第二届。迈尔-舍恩伯格说,举办互联网大会是中国向世界各国展示互联网和数字技术发展成就的绝佳机会。他期待大会能更多地关注中国互联网企业家们这些年来的成就,也希望通过这次大会,能帮助中国本土的互联网企业继续保持创新的力量。
互联网世界不存在绝对的安全
谈到互联网风险,无论是2012年著书时,还是现在,迈尔-舍恩伯格说安全问题一直是首要考虑的对象。
谷歌、亚马逊,以及阿里巴巴、华为等,都相继推出了云服务,但庞大的数据存储于这些大公司云端,是否意味着更高的安全性?
“如果有一家公司说自己的云服务绝对安全,那它简直是疯了。”迈尔-舍恩伯格表示,云安全是一个非常宏大的话题,许多互联网公司在不远的将来都必定会投入更多资金和精力在数据安全和服务安全上。因为在互联网世界中,不可能存在绝对安全;即使纵观整个人类历史,也不存在绝对之事,除了每个人都终有一死。
不过,他紧接着指出,大企业的互联网安全技术已经远好于大部分小企业,因为黑客们已经瞄准大企业多年,因而多数大企业的安全系统一直在更新换代。“真正需要担心的是小公司,尤其是一些新近创业的中小企业,他们的网络安全更需要警惕。”
为何互联网安全越来越重要?原因很简单。
迈尔-舍恩伯格表示,当越来越多的交易和人类互动都从线下转移到线上,并且愈发数字化,那么针对互联网世界的犯罪也就随之水涨船高。在互联网世界中,能以非法手段获取的财富远超线下,因而犯罪手法也就愈发复杂。同时,随着互联网技术的复杂和升级,许多小公司(包括国家和地区)的信息安全系统和安全网络已经跟不上当今潮流,不少企业和国家都处于在互联网世界“半裸奔”的状态。相比赫赫有名的大企业们,籍籍无名的小企业才更应该担心正对自己虎视眈眈的互联网风险。
对互联网的盲目崇拜也是风险
对于中国的互联网安全,迈尔-舍恩伯格延续了自己的看法,认为中国只要保持目前对互联网安全的投入趋势就好。
“我担心的反而不是中国这样的互联网大国。”他表示,对于那些互联网产业刚刚兴起的国家,安全问题对于他们来说更为重要。在他看来,正是因为互联网在这些国家还处于刚起步,加之他们对互联网安全的投入相当有限,所以,这些国家就容易成为互联网犯罪的首要潜在攻击对象。
个人信息安全也是互联网安全中最为脆弱的一环。互联网掌握人们的数据越多,个人对自身信息的掌控力就越弱,个人数据被窃取、滥用甚至用于犯罪的可能性也相对越大。
对于滥用大数据的现象,迈尔-舍恩伯格表示,如果的确存在通过大数据分析来欺骗消费者和客户的行为,那么造成这一现象的最主要原因就是买方和卖方的信息不对称。
听起来和线下交易极度相似?但是要注意,互联网诞生的一大使命就是为解决信息不对称的。迈尔-舍恩伯格说,相比线下交易,互联网上的信息不对称能够通过数据传递迅速解决,这是线下商务无法比拟的。因此,只要数据存在,人们在网上交易时,就能通过数据信息了解自己所承担价格是否合理、这笔交易究竟“值不值”。
但是,我们也不得不承认,互联网在为生活提供便利的同时,也让保护隐私的法律手段失去了掌控。
以个人数据安全为例,在《大数据时代》中曾提到,面对大数据,保护隐私的核心技术不再适用。同时,从大数据本身和大数据分析结果获益的人,可能会将大数据放到并不适用的领域,还可能过分夸大、人为提升对大数据分析结果的信赖。当然,最坏的结果,就是将大数据用于犯罪。
此外,迈尔-舍恩伯格表示,还有一大风险正在形成,但还来得及避免的,那就是对互联网的盲目崇拜。因为,互联网并不是那么的无所不能。
精确性不再是探索世界的重心
2012年,维克托·迈尔-舍恩伯格和《大数据时代》 的另一位作者肯尼思·库克耶意识到,世界上最富创新力的企业正越来越重视数据,并且数据已不再是交易的副产品,而是能增加新思维和经济效益的宝贵资源。所以,两人决定撰写一本关于大数据的书。
迈尔-舍恩伯格说,书中并不存在哪一个部分是对中国或是其他任何一个单一国家特别重要的,也不存在哪一个章节比其他更重要。“因为只有当所有概念融合在一起,这本书才有意义。”他说,如果《大数据时代》要再版,原书中没有内容需要删去,只是会多增加一些实际案例,可能会增加一章,专门讲述大数据在这三年来已经如何影响和改变各个经济领域。
谈到大数据在互联网中的运用,迈尔-舍恩伯格认为,通过互联网,大数据对人类最大的影响或许就是改变了人类探索世界的方法,而这一改变的影响力还将持续下去。
比如,人们在脸书上看到有人发了新消息,下面都会有一个“喜欢”按钮来点赞,同时也能看到有多少人也喜欢这条消息。当数量不多时,会显示诸如“13”、“109”这样的精确数字;而当点赞数量庞大时,反而只会显示一个近似值,如“6000”、“41k(41000,k表示千)”。脸书系统并非不知道确切点赞人数是多少,而是当持有相同观点的人数变得颇具规模后,具体数字已经不再重要。人们已经得到结论,并能就此趋势做出相应的判断。
两位作者在《大数据时代》中提到,谷歌的翻译之所以比其他公司的翻译服务更好,并非谷歌拥有更好的算法机制,而是增加了各式各样看似无用,甚至是错误的数据。2006年,谷歌发布的上万亿的语料库,正是来自互联网的一些“无用”的内容。而谷歌将此作为“训练集”,使谷歌翻译服务能够正确推算出英语词汇搭配的更多可能性。
可以说,谷歌的这一尝试与数据、算法已经没有特别大关联。事实上,当年的这一尝试,恰好体现了如今在中国最常被提起的“互联网思维”。如同网络新闻可以不断被更新,甚至修改,互联网的一大重要特质就是容错。当精确性不再是我们探索世界的重心,我们就必须学会接受混乱和错误的存在。“人们正变得更侧重于分析不同事物间的相关性,而不再寻求每个预测背后的原因。”迈尔-舍恩伯格说。
对于中国互联网,尤其是发展堪比宇宙速度的电商产业,迈尔-舍恩伯格说,这基本在他的预料之中,因为中国广袤的市场和消费者基数给予了电子商务发展的理想环境。任何一个新点子,或是新产品,都能通过互联网迅速传达给十亿潜在消费者,而这十亿人又说着同一种语言,生活在同一个法律体系中。
这意味着什么?“意味着只需要一晚,甚至更短时间,好的想法、好的产品,就能让亿万人知道。”这在其他任何一个国家都无法想象,也是无法达到的规模。
三年前,迈尔-舍恩伯格和库克耶曾表示,当人类准备开发电子商务、寓生活于互联网、进入计算机时代或者拿起算盘时,这些行为的产生比背后存在的问题更加重要。
三年过去,互联网世界的变化速度与日俱增,但万变之中有一点不曾变过。“通过互联网,大数据将改变一切,可能超越我们所有人的想象。”迈尔-舍恩伯格说。