数据新闻和传统新闻,没那么不同|专访 Alberto Cairo

  说起数据新闻,你可能会想到数据图表、炫酷的可视化效果;可能会想到一些工具,比如Excel、Python、Tableau等等;也可能一头雾水。数据新闻在中国还年轻,但行业从业者、学术研究者、个人创作者们,已经围绕着它做了不少探索。

  这一次,中国传媒大学新闻学院“白杨数新观察”团队和澎湃新闻“湃客·有数”共同推出系列访谈“数据新闻访谈录”。

  我们抱着观察记录、答疑解惑的想法,采访了国内外十多位在数据新闻领域有创见、有思想的学者、媒体人及学子,阐释数据新闻的新理念新发展,介绍数据新闻教育的经验、方法和路径,分享数据新闻作品的创作过程,在数据新闻的业务实践前沿、行业发展前景、教学体系现状等话题中进行思维碰撞。

  引言

  Alberto Cairo,现任迈阿密大学传播学院(UM School of Communication)新闻学教师,也是一名记者和设计师,他拥有在多个国家统筹可视化团队的经验。Alberto Cairo 于 2012 年 1 月加入迈阿密大学,主要讲授信息图和数据可视化(infographics and data visualization)相关课程,同时他也开发了新闻学在线课程,是数据新闻实践与教学领域的先驱人物之一。

  在新闻业演变的过程中,数据得到了更为广泛的应用。数据可视化不再只是对书面故事的补充,正在成为被广泛使用的报道形式和记者必不可少的工具。Cairo 认识到了可视化的巨大潜力,但也看到了这种新形式带来的挑战:关于如何向公众呈现和解释数据,以及数据可能存在的负面作用。对此,他将自己对于从业者及公众如何应对数据欺骗性问题的思考写成了学术专著。他是数据可视化的热情推动者,也致力于让数据新闻走向大众。 

  在 Cairo 看来,数据新闻的本质是运用数据,更需要关注的是数据背后的人群。

  以下来自与 Alberto Cairo 老师的对话节选。

  Alberto Cairo,迈阿密大学传播学院教师,密歇根大学数据科学与计算研究所可视化、数据通信与信息设计中心主任,Abess 生态系统科学与政策中心(Leonard and Jayne Abess Center for Ecosystem Science and Policy)的教师。

  Cairo 著有多本有关数据新闻与可视化的书籍。他通过《不只是美:信息图表设计原理与经典案例》(The Functional Art: An Introduction to Information Graphics and Visualization,New Riders,2012,中译本已由人民邮电出版社于 2019 年出版)、The Truthful Art: Data, Charts, and Maps for Communication(Peachpit Press,2016)、《数据可视化陷阱》(How Charts Lie: Getting Smarter About Visual Information,W.W. Norton,2019,中译本已由机械工业出版社于 2020 年出版)等著作,揭示图表和数据的欺骗性,帮助人们驾驭数据驱动的世界。

  2000 年,正在西班牙国内发行量第二大的日报《世界报》(El Mundo)工作的 Alberto Cairo 领导创建了该报的交互式信息图表部门(Interactive Infographics Department),这个部门被广泛认为是在线新闻的先驱。

  2010 年 6 月,Cairo 担任 Editora Globo(巴西最大媒体集团的杂志部门)的信息图表和多媒体总监,并担任该集团杂志的执行编辑。

  2012 年,Cairo 与美国德克萨斯大学奈特中心(Knight Center)合作,创建了世界上第一个新闻学大规模开放在线课程(MOOC),这门课吸引了来自 200 多个国家的 30 万有余的学生。

  其大型调查项目 Zones of Silence 获得 2019 年 Sigma 数据新闻奖,被微软描述为“可视化新闻的先锋”。

  Cairo 在近三十个国家进行了教学和咨询,也在互联网平台分享数据新闻知识,他的可视化博客(http://www.thefunctionalart.com/)和个人 Twitter 账号(https://twitter.com/AlbertoCairo),吸引了众多对可视化和数据新闻感兴趣的用户。

  图片来自 Alberto Cairo 个人博客http://www.thefunctionalart.com

  Q1:与传统新闻相比,数据新闻除了形式上与之的差异外,在报道角度上两者有什么差异,它们各自的侧重点是什么?

  Alberto Cairo:我认为不存在这样的差异。从某种意义上说,它与其他任何类型的新闻没有区别。它可以是对突发新闻的反应,也可以提供背景信息或者深度,就像传统的新闻报道所做的一样。

  让数据新闻变得特殊的仅仅是系统地使用数据,把它作为一个信息来源,作为一个工具,作为一个媒介,作为一个故事的来源来审视,这是数据新闻与其他新闻形式最大的区别。而另一个区别,也许我们可以称之为数据新闻与传统新闻的区别是——数据新闻是对技术的使用。在一般情况下,数据新闻使用到的技术通常比传统新闻更多,但是这有一个连续的过程,传统新闻和数据新闻之间并没有一个明确的分界线。

  比如说,有很多传统的记者,他们拿起手机给消息来源打电话、和不同的人谈话,他们不用加载一个数据集,而是分析自己从电话中听到的数据内容,再把分析的结果纳入他们的故事中,这个分析的过程就是数据新闻的意义,像新技术与传统技术的结合。

  但是我再次重申,二者之间没有一个明确的界限。

  Q2:比起文字、视频、HTML5 等其他形式的新闻,可视化新闻的优越性是什么?

  Alberto Cairo:数据新闻的本质就是“运用数据”(using data)来进行新闻报道,特别是数字化的数据,将数据以某种方式转化为数字形式来执行与新闻有关的任务。

  我们的报道来源是数据,无论我们是否将这些数据可视化或转化为文本和视频,底层来源仍然是数据。我们可以与其他来源相结合,比如与人交谈、录制视频等,但其中一个来源一定是数据。

  在过去的十五年里,我看到了数据在新闻业中的发展,数据得到了更为广泛的应用。但是,在展示数据的见解方面,数据新闻与其他媒介相比,本身没有什么优越性,每一个故事都可能需要你用不同的方式去转化信息。不同信息适合不同的呈现方式,有些故事需要通过视频来讲述,有些故事通过音频和采访来讲述更好,有些故事最好是通过创建一个数据库,让人们可以探索和分析。

  比如说,如果你想做一个类似于线性可视化解释(linear visual explanation)的东西,那么一个动画或视频、辅以负责解释的配音,通常是最好的方式之一。而如果你想让读者自由地探索数据,比如展示不同的政党在特定地区的选举结果,那么一个交互的数据可视化会更适合,或者是建立一个数据库,人们可以在其中放大并看到自己地区的结果。

  以此类推,不同类型的新闻故事需要不同的呈现方式。至于优先考虑哪种形式,我认为取决于以下几个因素——首先是数据的性质、受众的性质,然后是你想要传达的信息类型的性质,以及你在设计时的目的。以上是我自己在工作中思考的几个方面。

  呈现新闻故事的目标驱动着风格的选择、图形类型的选择,以及优先考虑文字还是视觉。所以这一切都取决于故事,取决于信息。

  Q3:枯燥的数据可能会降低数据新闻的叙述价值,如何能更好地处理理性和情感的关系,并找到公众感兴趣的话题?

  Alberto Cairo:这和写一个故事没有什么不同。比方说,当你写一个基于 30 个人物采访的新闻报道,你不会仅仅简单地转录这 30 个采访,然后就把访谈记录丢掉。你要决定展示什么、如何展示、新闻的结构是什么、你要使用这些引言中的哪些部分等,这些都要经过一个编辑的过程。

  在数据新闻中也是如此,你不会把整个数据集扔给读者,虽然这可以通过数据库来完成,但你首先要呈现的是概括性的信息,对数据中的主要发现进行有意义的、足够深入和有趣的总结。所以数据新闻的编辑过程与创作任何其他类型的新闻故事没有什么不同。

  Q4:数据新闻的目标受众是哪些群体?您怎么看待数据新闻的阅读门槛?

  Alberto Cairo:无论这条报道是否基于数据,都需要考虑受众理解某种新闻故事的能力。新闻报道的易懂程度,与受众对于某种媒介报道形式已有的知识储备、这则报道所用的语言都有关系。

  比如说,你把一则新闻写得比较高深,所用的语言达到了大学的水平,然后你把这个新闻给一个初中生看,他们显然不会理解这个故事。在数据新闻这一领域也是同样的,你不能把高度复杂的互动可视化数据呈现给不习惯可视化的观众,这会让他们感到困惑。但这并不意味着你不能使用可视化,你需要在受众能够理解的内容和你能够呈现的内容之间找到一个契合点。

  不过,我们也可以向受众呈现一些稍微新颖的东西来挑战一下受众,因为这是我们教育和培养受众的一种方式。通过使用新颖的信息呈现方式来增加知识,增加他们对我们所呈现的故事的理解。

  但尽量不要走得太远,因为新闻的主要目标是理解,通过一点点尝试新的东西来提高门槛,看看人们有何反应,逐渐地增加受众理解复杂性故事的能力。这与我们在新闻界长期以来所做的没有什么不同。

  Q5:您的职业生涯伴随着新闻业的重大技术发展,技术进步和数据驱动是如何改变传统新闻生产模式的?当前数据新闻面临哪些局限?

  Alberto Cairo:我只能谈论新闻业中的一个特定领域,那就是信息的可视化。显而易见的是,现在数据的可用性越来越高,数据可视化工具越来越多,改变了新闻信息图表领域。在我开始职业生涯之初,也就是 20-30 年前,数据库很不容易找到,并且数据也很难处理,数据可视化的使用在新闻信息图表中并不常见,当时人们主要倾向于使用插图来解释事情。

  但是到了 2000 年前后,数据变得更加普遍、容易获得和数字化。与此同时,许多国家的开始设立和数据透明性、数据公开有关的法条,这使得人们可以从处获得可靠的开源数据,促进了新闻信息图表领域的转型,推动从业者开始制作更多样化的新闻信息图表。

  过去的可视化团队早期主要由视觉设计师和艺术家组成。但现在,我们这些团队开始纳入其他类型的专业人员,比如程序员、开发人员、统计学家,他们可以理解、处理、转换和分析数据。

  然而,当前数据新闻目前面临的局限之一是数据的可获得性。这取决于国家的数据是否可靠、是否容易获得、被控制的程度,这是一个很大的现实问题。

  数据新闻生产目前面临的另一难题就是记者关于如何处理数据的知识不足——比如编程、编码、统计、分析等知识。但与获取数据相比,我认为这是一个非常次要的限制。 

  Q6:一份数据从生产到分析,有可能造成错误的洞察,您是否有被数据欺骗过的经历?对于公众和数据新闻工作者,可以采取什么措施来避免受到数据欺骗性的影响?

  Alberto Cairo:我已经受到数据欺骗性的影响了。我在最新的书中有几个例子,谈到了我的一个学生剧情片做的一个项目,关于佛罗里达州的无家可归者。我误读了数据,也在最新的书中讲述了这个故事,直到这个学生向我解释数据的真正含义,我才得出结论。

  注:中文版《数据可视化陷阱》中,Alberto Cairo 写道:

  “我的研究生路易斯·梅尔加,现在是在华盛顿特区工作的一名记者。他做了一项名为‘没有屋顶的学校’的调查,关注的是在佛罗里达州入学的无家可归的孩子们的故事。这些流浪儿童的数量从 2005 年的 29545 名增加到 2014 年的 71446 名。在佛罗里达的部分郡县,超过 1/5 的学生无家可归。

  我看到这个结论很震惊。这是否意味着有如此多的学生露宿街头?至少,我对‘无家可归’一词是这么理解的,不过这与现实相去甚远。在路易斯的故事里,佛罗里达的公共教育体系对‘无家可归’的定义如下——如果学生缺乏‘固定的、正常的、可以保证充足的夜间住宿时间的住所’,或者学生‘由于失去房屋’或‘经济困难’而与非近亲合住,则将其定义为无家可归。

  这么看来,这些学生中的大多数并不会露宿街头,但他们也没有一个稳定的家。经过这番解释,现在的情况听起来没有那么吓人了”。

  培养对数据的敏感性以及批判性思维,从而避免数据的欺骗性,这不是我们和记者可以轻易做到的,这是一个关于教育的问题和挑战。因此需要关注小学、初中和高中教育,使大家了解如何阅读——如何阅读科学信息、如何阅读新闻、如何进行批判、以及如何更多地接近信息。

  Q7:您对数据新闻专业的本科生和研究生有什么学业建议?

  Alberto Cairo:我给数据新闻专业的从业者和学生的建议是,永远不要忘记,数据的背后是人,这是我们的核心目标。

  不要只关注编码和编程技术,因为这些都是很快就能理解的,应该尝试学习系统化的数据统计,采取人文主义的视角理解数据。

  数据新闻不是为了呈现数据,而是为了服务于数据所呈现的那些人、为了告知公众。数据只是一种媒介、一种实现目标的手段,而目标是理解,即一个群体用他们的理解去实现一些事情,这将是最终的目的。

  之后显然需要学习编码、设计、编程,这些是坚实的工具,对任何人都是有用的。但不要忘记数据只是一个来源,就像与人交谈一样,可以说是各种信息来源中的一种。所以永远不要忘记新闻业的主要目标是什么。

  参考资料

  阿尔贝托·开罗. 数据可视化陷阱[M]. 韦思遥,译. 北京:机械工业出版社,2020:96-97.

  采写:林思婕 陆奕钒 周钰千 胡诗丹 惠子

  编辑:汪惠怡 张钰钰

  统筹:詹新惠 汪惠怡 湃客·有数

  封图来源:Microsoft Story Labs: Show, don't tell