蒋 炜 :用数据说话

时间:2014.05.08 来源:EMBA办公室

“ I n G o d W e T r u s t , A l lOthers Use Data”数据的价值和重要性已经成为公知们的共识,数据已经脱离了原先单一科学的概念,引领我们所处时代的发展趋势,成为我们这个时代的印记,影响着我们政治决策、经济发展和社会变革等诸多领域。

数据胜于雄辩

数据胜于雄辩,卓然发生在2012年美国第57 届总统选举,这场有史以来最激烈、最昂贵的总统选举。民调显示,大选关键的三场电视辩论使共和党总统候选人罗姆尼支持率大幅提高,一举扭转持续落后的劣势,使选情陷入持续胶着状态。面对罗姆尼的追问、反诘以及嘲讽,奥巴马完全招架不住。会后,左倾媒体民调显示:看过首场辩论后,35% 的受访者倾向投票给罗姆尼,只有18% 说要投给奥巴马。

然而结果是奥巴马赢得大选,其竞选团队中的数据分析人员功不可没。从总统大选一开始, 竞选团队主管Jim Messina 意图打造一个以数据驱动、完全不同于以前的竞选活动。大选前,高达10 亿美元的募款目标被设定后,所有人都觉得这是不可能的任务。但强大竞选团队中的数据分析人员通过网络和数据搜集,积极分析选民支持状况,进而分析怎样的说词更容易募款。极具针对性的宣传策略使奥巴马团队在夏天就早早完成了募捐目标。同时,海量数据分析挖掘也被运用在竞选广告的购买投放和建立“摇摆州” 选民投票偏好的详细模型上,使其对于在哪些州、哪些地区竞选有哪些偏好类型,应以何种方式投放多少广告了然于胸,极大地提升了竞选活动效率。

数据挖掘支持下的决策为奥巴马的连任立下了汗马功劳。这表明传统基于直觉与经验决策的竞选专家的优势在急剧下降,取而代之的是数量分析专家与电脑程序员,可以在对数据分析中做到洞若观火。在政治领域,大数据时代已然来临。”

大数据时代的来临

大数据(Big Data) 的来临仿佛正是忽如一夜春风来, 千“ 数” 万“ 数” 机遇到。一个个关于大数据的传奇故事,一桩桩为争夺大数据制高点而展开的并购案,一场场以大数据为主题的研讨会,无一不在宣告,这个时代又迎来了新的热点、机遇和挑战。“ 大数据” 已经颠覆传统意义上所谓数据库或者大量数据,是对数据中心处理分析的重塑,是一个涵盖多种技术的概念,是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。IBM 将“大数据”理念定义为4 V,即大量化(Volume)、多样化(Variety)、快速化(Velocity)及由此产生的价值(Value)。

为什么“大数据”在这两年走红?主要归结于互联网、移动设备、物联网和云计算的迅猛发展,使得人类每分每秒都在产生巨量数据。从出现文明到2003 年,人类总共才创造 5 EB数据,但现在仅在两天内就创造出相同的数据量。IBM 研究称,整个人类文明所获得的全部数据中,有90% 是过去两年产生的。

大数据已经成为一种新的资产类别,就像货币或黄金。“数”中自有黄金屋,点“数”成金的故事为人所津津乐道。麦肯锡在2011 年5 月发布的《大数据:创新、竞争和生产力的下一个前沿领域》中表示,充分利用大数据可帮助全球个人定位服务提供商增加1000 亿美元收入、欧洲公共部门管理每年提升2500 亿美元产值、美国医疗保健行业每年提升3000 亿美元产值,美国零售业获得60% 以上的净利润增长。2012 年“ 光棍节”,阿里巴巴出现一组近乎疯狂的数据:一天成交191 亿元,超过1 亿笔!从交易角度看,它做的是电子商务。而从电商交易实质看,做的实际上是信息和数据服务,提供的是撮合交易服务,是供需双方的信息。此外,靠着电子商务,积累了大量企业和个人信息数据。对于未来的发展方向,马云提出了“三步战略”:平台、金融、数据。美国电讯业在经历了政府主导的分拆、反垄断法后,正面临着前所未有的市场竞争和新技术挑战。挖掘海量数据为公司发现客户价值、推送定制服务、合理配置有限资源提供了科学的判断和决策,从而有效提升了企业的市场竞争力。可以预见,大数据对宏观经济、中观产业、微观企业和个人层面的影响正与日俱增。

数据的“农”、“工”、“商”

伴随大数据时代到来的是与数据采集、分析处理、优化管理相关的产业和产业链。众多学者和企业家一致认为,在未来数据会像土地、石油和资本一样, 成为一种最基本的资源,在现代社会生活和发展中发挥不可或缺的重要作用。数据也可以在农、工、商三方面发展,“农”在于数据的培植、收集和存储,任何组织或个人都要养成积累、收集、管理数据的良好习惯,为决策研究打好坚实的数据根基。“工”在于对数据的分析、加工、检索、处理等工序,把杂乱无章,看似无序的数据分析加工成能为我们所用的利器,最大限度开发数据的功能,发挥数据的作用。“商”意味着对数据价值的应用和挖掘,从数据分析中获得更多商业价值,正如目前如火如荼的云计算产业。许多昨日的IT 业巨头如IBM、Oracle, 通过收购SPSS、CrystalBall 等数据分析系统,正在完成了从“农”、“工”到“商”的整合,有些甚至组建了自己的Analytics 分析团队,为公司内外提供更多、更广泛的服务。Google 首席经济学家Hal R.

Varian 断言,未来十年最热门的工作将是数据科学家。同样,笔者认为数据农夫Data Farmer 也将成为数据科学家队伍的重要成员。各类数据培植、采集、积累和存储,都是基于日常数据、常见数据、周围数据的辛勤耕种,是对“小”数据的尊重和培养。坚持收集、积累、使用数据,小数据也会变成大数据,大数据的“大”是一种机会,而小数据一样可以说话。 

小数据也一样能说话

很多学生在做科研,在大胆臆测、公式推导、定量分析、实证研究、引出结论时往往由于缺乏相关数据、难以过关的数据质量甚至无法说清的数据来源而停滞不前。同样在任何一个企业、一个领域如果需要做出一些变革,都要基于以往数据,在此基础上进行分析调研,得出相关结论。因此没有数据,寸步难行。很多企业最担心是数据质量和由此得到结论的可信性(“垃圾进,垃圾出”)。事实上,通过学习系统的数据分析方法和正确的统计理论,可以做到去粗取精,去伪存真。

数据质量如同产品质量一样,永远是数据“消费者”必须面对的课题。同样,数据“消费者”对数据的累积也并非一两天可完成,对于看似零散混乱的小数据,要做到持续、稳定地收集,不积跬步无以至千里,不积小流无以成江海。长时间所累积的数据不光使数据质量的改善成为可能,更会使深层时间的思考成为了可能,体现了严谨的科研工作者前瞻、耐心和智慧的美德。  

相信数据、尊重数据、大胆使用数据

实“数”求是,真理往往隐含在数据中,但真理的发现并不容易。前有Giordano Bruno 为探索天体运行的科学真理而献身,Isaac Newton 从数据中发现三大运动定律和万有引力定律,今有Edward Deming 基于数据的质量科学方法和William D. Gann 的股价数据中的真理。对数据的尊重,对真理的敬畏,使得这些科学大师与商业精英认识到,只有苦练基本功,不墨守成规,努力不懈地研究新事物与新方法,才能在纷杂的数据中找寻真理的踪迹,也才有可能享受真理带给人类的幸福与快乐。相信数据、使用数据不仅仅是学者研究所必需的方法,更是一种积极的人生态度。今天的学子们,请珍惜在校学习的机会吧,谁言理论脱离实际,没有深厚的理论基础,怎能从纷杂的数据中辨识真理与谬误? 愿你们相信数据, 尊重数据,大胆地使用数据,因为它不仅是一种方法,更是一种自信,总能在千头万绪中给予你可靠的指引。

供稿人:EMBA办公室 廖蓓