研究发现数据可视化是一把“双刃剑”
导读:自COVID-19大流行开始以来,图表和图形帮助传达了有关感染率、死亡和疫苗接种的信息。
自COVID-19大流行开始以来,图表和图形帮助传达了有关感染率、死亡和疫苗接种的信息。在某些情况下,这种可视化可以鼓励减少病毒传播的行为,如佩戴口罩。这次大流行被誉为数据可视化的突破性时刻。
不过新的发现展现了一个更复杂的情况。麻省理工学院(MIT)的一项研究显示,新冠病毒怀疑论者如何在网上利用数据可视化来反对公共卫生正统的口罩规定的好处。这种“反视觉化”通常相当复杂,其使用的是官方来源的数据集和最先进的视觉化方法。
研究人员梳理了数十万条社交媒体帖子,结果发现新冠病毒怀疑论者经常会在使用跟公共卫生专家相同的“遵循数据”的言论的同时部署反视觉化,然而怀疑论者主张的政策却完全不同。研究人员得出结论,数据可视化并不足以传达COVID-19大流行病的紧迫性,因为即使是最清晰的图表也可以通过各种信仰系统进行解释。
“很多人认为感染率等指标是客观的,”Crystal Lee说道,“但它们显然不是,基于对如何思考大流行病的争论有多大。这就是为什么我们说数据可视化已经成为一个战场。”
这项研究将在5月举行的ACM计算机系统中人的因素会议上发表。Lee是这项研究的第一作者,也是MIT历史、人类学、科学、技术和社会(HASTS)项目和MIT计算机科学和人工智能实验室(CSAIL)的博士生,同时也是哈佛大学伯克曼-克莱因互联网和社会中心的研究员。共同作者ZE 包括人类学领域的玛格丽特-麦克维加学院研究员Graham Jones、电气工程与计算机科学系和CSAIL的NBX职业发展助理教授Arvind Satyanarayan、MIT本科生Tanya Yang和韦尔斯利学院本科生Gabrielle Inchoco。
随着数据可视化在这一流行病早期的崛起,Lee和她的同事们开始了解它们是如何在整个社交媒体领域被部署的。“一个最初的假设是,如果我们有更多的数据可视化并以系统的方式收集的数据,那么人们会得到更好的信息,”Lee指出。为了测试这一假设,她的团队将计算技术与创新的人种学方法相结合。
他们在Twitter上使用他们的计算方法收集了近50万条提到“COVID-19”和 “数据(data)”的推文。通过这些推文,研究人员生成了一个网络图以找出“谁在转发谁,谁喜欢谁”。Lee表示:“我们基本上创建了一个相互交流的社区网络。”群组包括“美国媒体社区”或“反口罩者”等群体。研究人员发现,反口罩者群体在创建和分享数据可视化方面跟其他群体一样多,甚至比他们更多。
然而这些可视化的东西并不马虎。Satyanarayan指出:“它们跟主流来源分享的数据几乎没有区别。它们往往和你期望在数据新闻或公共卫生仪表板中遇到的图表一样精巧。”
“这是一个非常引人注目的发现。它表明,将反口罩群体定性为数据文盲或不参与数据,这在经验上是错误的,”Lee说道。另外,他还表示,这种计算方法使他们对COVID-19数据的可视化有了广泛的了解。“这项定量工作真正令人激动的是,我们在一个巨大的规模上做这种分析。我不可能阅读50万条推文。”
但Twitter的分析存在一个缺点。“我认为它错过了人们正在进行的对话的很多颗粒性。你不一定能跟随一条对话线的展开,”Lee说道。为此,研究人员转向了一种更传统的人类学研究方法--带有互联网时代的扭曲。
Lee的团队跟踪并分析了反口罩Facebook群组中关于数据可视化的对话--他们将这种做法称为“深度潜伏”。“理解一种文化需要你观察日常的非正式活动--而不仅仅是大型的正式活动。深度潜伏是将这些传统的人种学方法移植到数字时代的一种方式,”Lee说道。
深度潜伏的定性发现似乎跟Twitter的定量发现一致。Facebook上的反潜者并没有回避数据。相反,他们讨论了如何收集不同种类的数据以及为什么。Lee说道:“他们的论点真的很细微。这往往是一个衡量标准的问题。比如,反口罩小组可能会争辩说,感染数字的可视化可能会产生误导,部分原因是,跟死亡人数等衡量标准相比,感染率的不确定性范围很广。作为回应,小组成员往往会创造他们自己的反可视化,甚至在数据可视化技术方面相互指导。”
Jones则指出,反口罩团体的科学理念不是被动地听着MIT这样的地方的专家告诉其他人应该相信什么。他认为这种行为标志着一种古老文化潮流的新转折。“反口罩者对数据素养的使用反映了美国根深蒂固的自力更生和反专家的价值观,这种价值观可以追溯到建国之初,但他们的在线活动将这些价值观推向了公共生活的新领域。”
此外,他还补充称:“如果没有Lee富有远见的领导力,策划一个跨越SHASS和CSAIL的跨学科合作,就不可能对这些复杂的动态产生意义。”
来自华盛顿大学的数据科学家Jevin West表示,这项混合方法研究推进了他们对数据可视化在塑造公众对科学和政治的看法方面的理解。West没有参与这项研究。West说道:“数据可视化带有客观性和科学精确性的外衣。但正如本文所显示的,数据可视化可以有效地用于一个问题的对立面。它强调了问题的复杂性--‘仅仅教授媒体素养’是不够的。它需要对那些创造和解释数据图表的人有更细致的社会政治理解。”
结合计算学和人类学的见解,研究人员对数据素养有了更细致的理解。Lee表示,他们的研究显示,跟公共卫生的正统观念相比,反口罩者以不同的方式看待大流行病,然而使用的数据却相当相似。Lee称,他们的发现指出了“在美国,我们对科学和专业知识的思考存在着更大的裂痕”。这种裂痕也贯穿了气候变化和疫苗接种等问题,在社交媒体的讨论中经常会出现类似的动态。
为了让公众了解这些结果,Lee和她的合作者--CSAIL博士生Jonathan Zong带领了一个由7名MIT本科生研究人员组成的团队。他们开发了一个互动式的叙述,这样读者就可以自己探索可视化和对话。
Lee将该团队的研究描述为在这些更广泛的辩论中理解数据和可视化的作用的第一步。“数据可视化是不客观的。它不是绝对的。事实上,它是一个令人难以置信的社会和政治努力。我们必须注意人们在科学机构之外如何解释它们,”Lee说道。