政界大数据时代或将尘埃落定行业资讯
据国外媒体报道,美国时代杂志特约撰稿人迈克尔-施尔乐(Michael Scherer)日前撰文对奥巴马竞选团队在总统大选中所使用的全新数据分析战略做出了一番剖析。施尔乐认为,竞选团队幕后的数据分析团队在此次奥巴马连任的过程中发挥了至关重要的作用,其重要性甚至远远超越了人们的想象。而在此次大选尘埃落定后,政界的大数据时代或许即将到来。
以下是文章主要内容:
“克鲁尼效应”
奥巴马竞选团队幕后的数据分析团队注意到乔治-克鲁尼(George Clooney,美国知名影星)对美国西海岸40-49岁女性具有非常大的吸引力,这部分女性甚至可以不远万里愿意为与克鲁尼和奥巴马共进晚餐而付出大量金钱。
在过去两年的筹备过程中,奥巴马背后的数据分析团队一直在收集、存储和分析选民数据。在这次的大选中,奥巴马竞选阵营的高级助理们决定将参考这一团队所得出的数据分析结果来制定下一步的竞选方案。他们的想法是,在东海岸找到一位对女性群体具备相同号召力的名人,从而复制“克鲁尼效应”并为奥巴马筹集竞选资金。
奥巴马竞选团队的一位高级顾问表示:“在我们面前摆放着无数的选择,但我们最终选择了莎拉-杰西卡-帕克(Sarah JessicaParker)。”因此,一场与奥巴马在帕克纽约的West Village豪宅共进晚餐的“竞争”就此拉开了大幕。
打造数字竞选
但是,普通民众不知道的是,这次活动的想法源于奥巴马数字团队对帕克粉丝研究所取得成果。他们发现,帕克的粉丝喜欢竞赛、小型聚会和名人。从总统大选一开始,奥巴马竞选团队主管吉姆-梅斯纳(Jim Messina)便承诺将打造一个完全不同、以数据为驱动力的竞选活动。在这一形势下,政治是最终目标,但政治嗅觉已不再是总统候选人取胜的唯一方法。
梅斯纳接受奥巴马竞选团队主管一职后表示:“我们会在此次竞选活动中对每个事件进行数据分析。”
随后,梅斯纳为这一团队聘请了一大批分析员,人数规模甚至达到了2008年竞选时数据分析部门的五倍,并让在数据挖掘领域拥有丰富经验的雷伊德-加尼(Rayid Ghani)出任芝加哥竞选团队总部的首席科学家(chief scientist)一职。加尼此前的工作便是收集大量数据,他曾经在分析数据后,得出了一个能够让超市销售效率达到最大化的方法。不过,这个数据分析团队的具体工作始终被严格保密。
安保严格
奥巴马竞选团队发言人本拉-波尔特(Ben LaBolt)在被问及相关问题时表示:“他们就是我们的核代码。”
据悉,在办公室范围内,这一团队会给各个数据分析项目以代码命名,比如“独角鲸”(Narwhal)、“追梦人”(Dreamcatcher)等。他们通常在远离竞选团队人员的地方办公,并在竞选总部的最北部设立了一个无窗的工作室。
这些人会为身在白宫罗斯福厅(White House's Roosevelt Room)的总统及其他高级助手制作每日简报。不过,有关这个团队的更多细节并没有对外透露,因为这个团队中暗藏了奥巴马竞选团队优于罗姆尼竞选阵营的杀手锏:数据。
2012年11月4日,奥巴马竞选团队的多位高级顾问同意向《时代》杂志谈一谈他们的工作。他们的条件是:第一,自己的名字不对外公开;第二,谈话内容在下任总统确定前不得公开。
在谈话中,他们披露了一些鲜为人知的内幕。比如,如何通过分析大量数据帮助奥巴马筹集到10亿美元资金;如何改变电视广告投放策略;如何制作出拉拢摇摆州选民的具体数据分析模型和最有效拉票方法的推荐,其中包括了邮寄信件、电话或者利用社交媒体这些方法。
整合资源
在2008年竞选中,奥巴马团队对高科技的利用赢得了不少赞扬,但其成功的背后也掩盖了一个巨大的弱点:即过多的数据库。
当时,通过奥巴马网站打电话拉票的志愿者和奥巴马竞选办公室所用的名单不同,而拉票名单与筹资名单也不,这就像911之前的FBI和CIA(美国中央情报局)从不会共享资源一样。
对此,奥巴马竞选团队的一位官员表示:“我们知道,民主党的问题就在于拥有了大多的数据库,且没有哪两个数据库是相同的”。因此,在总统竞选前的18个月,竞选团队就创建了一个庞大系统,这一系统可以将民调者、注资者、工作人员、消费者、社交媒体以及“摇摆州”主要的民主党投票人的信息进行整合。
整合后的数据库不仅能告诉我们如何发现选民并获得他们注意,还允许我们的数据分析团队进行一些测试,以预测哪些类型的人有可能被某种特定的事情所说服。就比如,竞选办公室的拉票电话名单不仅仅列出了姓名和电话号码,还按照他们被说服的可能性和重要性进行了分门别类的排序。在排序的决定性因素中,大约有75%都是包括年龄、姓别、种族、邻居和投票记录在内的基本信息。
作用巨大
竞选团队中的一位高级顾问透露:“我们可以预测哪些人会在线捐款,哪些人会通过电邮汇款,我们甚至可以对志愿者进行建模分析。到最后,数据建模在竞选过程中的重要性越来越高,远远高于08年的时候,因为我们发现通过这一方法我们的时间可以被更有效的利用。”
比如,竞选团队很早就认定,在08年大选中曾退订竞选电子邮件的那部分人群是他们的首要游说目标,竞选战略家们甚至为特定人群制订了相应的测试。比如,本地志愿者打电话的效果到底比一个从非摇摆州(如加利福尼亚州)志愿者打来电话效果好多少。就像竞选总指挥吉姆-梅西纳(Jim Messina)所说的那样:“没有数字作为基础的假设几乎不存在”。
幸运的是,这个庞大的数据库让竞选团队筹集到超过预期的资金。截至8月,奥巴马团队中的每个人都认为他们无法达到10亿美金的筹资目标。一位竞选团队的高级官员透露:“我们曾经就这一数字争论不休,因为我认为我们连9亿美元的目标都无法达到。但在夏天过后,我们的互联网驱动力开始逐渐显现。”
事实上,在通过网络筹集的资金中有很大一部分是通过以数据为导向的电子邮件营销所获得的,所以数据收集、分析对奥巴马竞选团队来说至关重要。在竞选期间,很多发送给支持者的邮件中只是为了测试,这些邮件采用了不同的主题、发件人与内容。在竞选团队内部有时也会进行“什么组合能够筹集到更多资金的调查”,但结果往往并不准确。
在春天,米歇尔-奥巴马(Michelle Obama)的电子邮件效果最出众。但有时,梅西纳的表现又超过了副总统乔-拜登 (Joe Biden)。在很多时候,募资最多的人能比表现不佳的人多募集10倍左右的资金。
奥巴马的芝加哥总部还发现,参加了“快速捐赠计划”( Quick Donate program,即可以通过在线或者短信的方式进行捐赠,而无需重复输入信用卡信息)的人所捐献的资金是其他捐献者的4倍,所以这一计划在后期被大力推广。10月底,“快速捐赠计划”已经成为竞选团队向支持者传递信息的重要组成部分,首次参与“快速捐赠计划”的捐献者还可以得到一个免费的车尾贴。
结果预测
奥巴马这种选项思路的好处在于,在得到了选民资金支持的同时也为自己笼络了人心。奥巴马的数据分析团队此前曾在关键州收集数据,并建立了4条投票数据流,用于拼凑出当地选民的详细数据模型。一名官员表示,在过去1个月,数据分析团队在俄亥俄州就获得了约2.9万人的投票数据,这一数字几乎已经占到了1%的总体选民数,因此奥巴马的数据分析团队可以更清楚的了解每类人群和地区选民在任何时刻的投票倾向。
显然,这为奥巴马带来了巨大优势。比如,当第一次电视辩论结束后,选民的投票意愿发生改变,那么这时数据分析团队就可以立即知道哪些选民改变了自己的态度,哪些选民仍坚持自己的选择。
正是通过所收集到的这些数据,奥巴马竞选团队分析出,大部分俄亥俄州的摇摆选民原本并非奥巴马的支持者,只是在9月罗姆尼竞选出现失误后才开始支持奥巴马的。
对此,奥巴马竞选团队中的一名官员表示:“我们比其他人更冷静。”
的确,每天晚上奥巴马的这一数据分析团队会不断分析选民的投票倾向,这些数据会经过多次处理,以考虑到不同情况下的结果。
另一名高级官员表示:“我们每天晚上大约都会试运行一次大约66000人次的大选,并在第二天上午模拟出结果以帮助我们了解奥巴马在部分地区获胜的可能,从而可以有针对性地分配资源。”
第二战场
在本次竞选中,奥巴马竞选团队首次利用Facebook这些社交网络进行大规模的游说,就像此前挨家挨户敲门拉票的方式一样。在竞选的最后几周,下载特定应用的用户收到了包括他们在“摇摆州”好友照片在内的多条消息,应用鼓励他们通过点击按钮来呼吁这些选民采取行动。这些“行动”包括有:鼓励选民投票注册、更早地进行投票并积极参与到民意调查中。