浅谈大数据在CPI调查中的应用 行业资讯
近年来信息技术取得突破性进展,行政管理、生产经营、商务活动等领域的数据量出现爆炸式增长。2009年开始,“大数据”成为互联网流行词汇,随后飞快地向社会各个领域迅速扩展,“大数据”时代已经来临。作为与数据有着天然联系,以数据生产、加工、管理和开发为主要工作的部门,政府统计正面临前所未有的机遇和挑战。CPI(居民消费价格指数)作为一项重要的民生指标,统计调查的拳头产品,在“大数据”时代如何更加准确地反映物价走势,提高数据质量,是各级统计调查系统正在积极思考的重大课题。
CPI调查应用“大数据”的必要性
“大数据”既是信息技术快速发展的产物,也是市场经济深入发展的必然要求。CPI调查方法也应该随着市场情况的发展而调整。“大数据”的出现,对消价工作既是挑战,也是机遇。
市场的快速发展对CPI调查提出了巨大的挑战。近年来,居民消费品和服务呈现了爆炸式的增加。改革开放初期耐用消费品以“三转一响”为代表,随后快速增加了电视机、洗衣机、冰箱、空调、电脑、汽车等内容,目前,耐用消费品种类已不下几十种。市场需求的细化,也让消费品的差异越来越大,规格型号越来越多。手机刚上市时不过几个品牌,十几种产品,目前手机品牌已经近百个,产品更是千差万别。另外消费品的增加还有逐年加快的趋势。目前CPI规格品设置明显落后市场的发展,对于主流规格品的把握也存在较大的主观性和滞后性。
“大数据”为提高CPI数据质量提供了良好的机遇。目前CPI调查的方法制度相对成熟完善,但不可否认,部分消费品价格指数还与市场实际存在较大的偏差。例如,全国CPI中衣着价格在“十一五”时期曾经出现连年下降的走势,这在整体物价上涨、成本不断提升的前提下,明显不符合实际情况;“十二五”以来,虽然衣着价格在指数上反映为走高,但不同城市仍然存在较大的差异,2013年1-8月江苏省辖市衣着价格涨幅的极差达到5.3%,在商品自由流通的条件下,这样的差异会引起很大的质疑;由于规格品设置不当,手机、电视等指数表现为直线下降,与百姓消费实际严重脱节;个别规格品价格的异常变动有时会对整个类别产生较大的影响,对价格趋势产生误导。产生以上问题的主要原因是目前我们规格品的数量和更新速度滞后于市场发展,代表性不足,对于某一地区或某一城市,规格品在规模上的代表性更值得商榷。“大数据”的重要理念就是通过使用大量数据来减少个别样本异常对于总体走势产生的干扰,这对我们提高数据质量具有重要意义。
CPI调查应用“大数据”的可行性
“大数据”具有数量大、速度快、源头多等特点,符合CPI调查数据全面、真实准确、上报及时的调查要求,可以作为消费价格调查新的数据来源与参考。
——管理模式的转变为CPI调查提供了数据基础。在现代管理中,决策方式逐渐由原有的凭经验或粗略估计转变为以各项报表和数据为基础的精细化运作。目前,很多政府职能部门都在尝试管理数据库与企业数据库直接对接,随时抽取相关的数据。企业在管理过程中也更加重视数据的即时收集和整理。政府部门和企业数据的丰富为我们直接利用相关数据提供了可能。另外,商品零售的集中化趋势能有效降低我们应用“大数据”的成本。调查显示,苏宁电器在南京的销售额已经接近市场总额的50%,再加上五星、国美两家,足够代表南京市的总体情况。
——“大数据”在CPI部分调查类别中已经有了初步应用。目前,部分规格品的采价实际上已经用到了“大数据”的概念。以南京队为例,飞机票价格采用东方航空公司月度均价;电影票价格采用影城月度平均票价;高中一年级学费采用的是每年开学南京所有学生一个学期的费用总额平均;阶梯电价和燃气价格改革后,我们将南京市居民各个档次使用量的数据,作为权数计算价格改革后均价;同时,对于比较敏感的房租价格调查,定期用中介房租平均涨幅来对采集的房租价格走势进行评估和修正。
“大数据”在CPI调查中应用方式初探
从“大数据”的初步应用以及近期调研情况来看,“大数据”可以在以下方面对CPI调查起到积极的推动作用。
——“大数据”可以帮助我们确定采价点和规格品。在方法制度中,对于采价点和规格品的选取最重要的原则是保证其代表性。
采价点的选择目前是根据粗略摸底的销售额进行排序,进行等距抽样,这样做一是数据未必十分准确,二是各个采价点商品销售结构存在差异,采价点未必对于所有规格品都是最合适的。应用企业详细的销售数据,我们可以根据具体的规格品在各个点的销售额进行分别排序,并进行抽选,这样保证采价点对于每个规格品来说都是具有代表性的。
在规格品的选择中,我们可以应用“大数据”,对某种商品的销售数据进行分析和跟踪,始终选择该规格品中销量最大的作为我们的代表规格品,确保代表性。也可以对一类商品的价格的相关性进行分析,找出与整体价格最相关的产品作为调查规格品。另外,对于一些更新较快的产品,如电子产品,可以根据各个型号销售的增长速度提前预判,确定备用规格品,以便即时替代。
——“大数据”可以对规格品价格趋势进行评估和验证。消价工作人员需要把握各个消费品价格的变动趋势,从而更准确地采集价格,及时更换失去代表性的规格品,更好地进行统计分析和数据解读。“大数据”为我们提供了一个科学合理的评估验证手段。
在采价过程中,如果某一规格品价格出现异常变动,“大数据”可以帮助我们剔除非市场因素部分,评估得出一个比较合理的价格。
在统计分析中,加入外部数据与CPI调查数据相互佐证,能够提高说服力,提高分析质量;在数据解读的时候,与一些权威数据进行比对验证,也能够进一步提高公众对CPI的认可,提升数据的公信力。
——“大数据”直接作为规格品的价格数据。现阶段,“大数据”在CPI中已经有了初步应用。在以后工作中,能够有效获取足够数据的前提下,对于一些规格差异很小的服务项目,例如部分家庭和个人服务,我们可以采用管理部门的价格数据或家政公司等企业的数据来平均计算出规格品价格;对于规格差异较大的消费品,我们可以以其中关键质量因素来锁定我们列入计算的规格品范围,以冰箱为例,我们可以将相同容积的冰箱作为一个规格品,计算价格。
目前网购在零售总额总所占比重已经达到10%左右,并有继续快速增长的趋势,将网购商品作为规格品是大势所趋。目前以淘宝为代表的电商平台数据统计已经比较成熟,在设计网购商品采价方法的时候,不妨可以直接跳过固有抽样采价模式,将电商数据按照CPI调查的需要进行整理加工,以“大数据”形式来计算规格品的价格。
CPI调查使用“大数据”存在的问题
把“大数据”应用到CPI调查从而提高数据质量是目前的大趋势,但局限于现有的调查条件,仍有很多问题需要关注和解决。
——“大数据”的获取仍存在困难。应用“大数据”,首先要取得外部数据,从实际操作来看,数据获取还存在以下困难:一是政府部门或企业数据与CPI调查需要往往不匹配。例如药监部门,虽然与各大药房数据系统实现共通,但主要是调阅各种药品实时的销量和库存等信息,并没有价格信息;部分商场虽然收录了实时的销售数据,但主要以品牌分类进行各种统计,与CPI规格品的设置要求有很大的差异。二是企业的销售数据是商业机密,绝大多数企业不愿意对外提供,而我们对企业没有强制约束力,具体的沟通也存在很多的障碍。
——“大数据”对调查原则的把握提出挑战。采用“大数据”,无论是规格品的选择还是应用混合平均价替代规格品价格,新规格品的构成都会与前一期产生差异,这是应用“大数据”在把握趋势上的优势,但对同质可比原则的把握程度不同,数据会出现较大的差异,因此实际操作方法需要非常清晰的界定。
——“大数据”质量需要重点关注。“大数据”是外部数据,相对直接采价数据,质量更加难以把握。一方面,数据在统计过程中难免会出现错误,使价格统计出现误差;另一方面销售企业由于提高商品档次等经营策略产生的价格波动对CPI调查是一种干扰因素。因此,我们还需要提高技术手段和工作能力,确保数据的真实、准确、科学、严谨。