Yelp评论把脉经济走势
作者:编辑部
2021-03-18
摘要:在缺乏最新官方统计数据的情况下,来自Yelp等在线资源的数据可以帮助你把握当地商业活动的脉搏。

企业会产生大量的数字废气,他们在运营过程中收集的数据的虚拟痕迹。例如,当你在网上购买一件衬衫时,你所使用的信用卡类型、购买时间以及其他非核心交易信息都会被采集和存储。问题是,它到底能有多大用处?

利用在线评论平台Yelp的数据,试图找出答案。在美国国家经济研究局即将出版的《21世纪经济统计大数据》一文中提到,Yelp的众包数据可以帮助衡量地方层面接近实时的经济活动,这与官方数据往往在多年后才公布形成鲜明对比。Yelp上被评论的企业和餐馆数量的变化可以帮助在相应的官方统计数据发布之前“播报”其变化。简而言之,像Yelp这样的来源可以在商业和政策制定中补充官方数据。

实时播报

以美国人口普查局的县域商业模式为例。CBP每年都会按州、县、大都会区、邮政编码和国会选区级别公布企业数量、员工数量和工资总额的统计数据,但有明显的时滞。截至2021年1月,CBP最新的数据是2018年的数据,汇总到邮政编码层面。

谷歌、LinkedIn和Yelp等在线平台收集的数据可能会填补这一空白。对于我们的论文,我和我的合著者放大了Yelp,截至2016年底,Yelp已经列出了370多万家企业,拥有6540万条“推荐评论”,或被认为是真实或有用的评论。

我们首先对Yelp和CBP在2009年至2015年的数据进行了对比分析。我们只有在企业收到至少一条Yelp推荐评论的情况下,才将其算作开业。我们的分析仅限于2009年CBP和Yelp中至少有一家企业的邮政编码。

2015年(CBP数据的最后一年),在餐饮业,CBP列出了24790个邮政编码中的542029家企业,Yelp列出了22719个邮政编码中的576233家企业。因此,Yelp对CBP的覆盖率为106%,这意味着Yelp可能捕获了更多的餐厅,而不是它错过的。这种模式在人口密集、较富裕的地区最为明显,这表明Yelp覆盖了没有员工的小店,这类企业被排除在CBP之外,居住在城市、较富裕地区的人们喜欢外出就餐并在网上分享他们的经验的综合效应。

然后,我们探讨了Yelp的数据是否可以在官方统计数据发布之前预测CBP中公司和餐馆的整体数量变化。我们发现,在计入CBP历史数据所能预测的内容后,Yelp数据可以占到剩余的餐厅开业数变化的26%,以及CBP剩余企业开业数的29%。

数据穷尽的局限性

进一步的分析显示,Yelp在更富裕、人口更密集、教育程度更高的邮政编码中更具预测性,这可能是出于前面提到的原因。在纽约市上东区这样的地区(人口:60453;面积:1.22平方公里),每一个新的Yelp企业都与0.75个额外的CBP机构相关联,而在不太富裕的地区则为0.5个,在教育程度较低、较贫穷和人口稀少的地方则为0.2个。

按行业评估Yelp的预测能力,我们发现Yelp数据可以预测零售业、休闲业、酒店业以及专业和商业服务的8.5%至10.2%的CBP变化,而公共服务、货物制造业或运输和批发贸易的预测能力为0.9%至8.2%。这一发现进一步凸显了市长和企业主使用Yelp数据进行nowcasting的局限性。

我们的研究表明,数字废气如何被重新用于与最初产生数据的用途完全不同的用途。越来越多的公司开始从事出售数据作为其收入来源之一,引起了人们对隐私的关注。对于寻求利用这些偶然数据的企业和管理者来说,我们的研究表明,他们将受益于对潜在回报的仔细评估,因为这绝不是一个多用途的工具。


热门文章