数据新闻50年简史(1967-2015)
本文由Brant Houston最初发表于第九届全球调查性新闻发布会的特刊上。
Brant Houston是伊利诺伊大学调查性报道专业的骑士会会长,同时也是《计算机辅助报道实用指南》的作者。本文的部分内容最初也刊登在了这本书及1999年版的尼尔曼报告中。
数据新闻的发端
数据新闻的发端可以追溯到对美国大选结果的预测。而大约60年后,电脑辅助的报道工具在全球范围内成为调查性报道的核心手段。
许多实践者将计算机辅助报道和数据新闻的发端回溯到了1952年。当时美国的哥伦比亚广播公司(CBS)试图让专家在大型计算机的帮助下预测总统选举的结果。这看起来与当下的数据新闻相去甚远,因为当时他们根本没有使用数据。直到1967年,数据分析才开始流行起来。
那一年夏天底特律发生了严重的黑人骚乱,为了了解并解释底特律骚乱,《底特律自由报》的Philip Meye运用了计算机对一份针对底特律居民的调查进行了分析。(几十年后《卫报》在英国使用了一些相同的方法来研究种族骚乱的事件并引用了迈耶的作品。)
在70年代,Philip Meye继续与地方报纸《费城问询报》(Philadelphia Inquire)的Donald Barlett和James Steele合作分析了当地司法系统的量刑模式,与Rich Morin在《迈阿密先驱报》(Miami Herald)分析了资产评估记录。Philip Meye还出版了一本书叫做《精确新闻》(Precision Journalism),解释并进一步提倡使用数据库分析和社会调查的办法来报道新闻,自此这本书一版再版。
然而,在80年代中期以前依然只有寥寥可数的几位记者采用了这些技术手段。那时的一个标志性事件是Elliot Jaspin在新闻中使用数据库进行分析而在《普罗维登斯杂志公报》备受赏识,他的代表作包括了对危险校车司机的分析和对与住房贷款有关的政治丑闻的调查。同时另外有50名左右的记者在80年代末经常与Philip Meye,Jaspin或者史蒂夫·多依格的《迈阿密先驱报》进行交流,开始在他们的新闻中报道进行数据分析。
这时,辅助记者们进行报道的是更加先进的个人电脑以及一个由Jaspin和新闻程序师Daniel Woods写的程序——Nine Track Express,这个程序使得电脑与磁盘间的信息传输更加便捷。这样的条件使得当时的记者得以绕过官僚机构和只能在大学或报社使用大型计算机造成的延期。
1989年,美国新闻业界终于承认了计算机辅助新闻报道的价值,并为《亚特兰大宪法报》(The Atlanta Journal-Constitution)调查住房贷款中种族差异的报道颁发了普利策新闻奖。同一年,Jaspin在密苏里新闻学院建立了如今广为人知的美国计算机辅助报道协会(The National Institute for Computer-Assisted Reporting -NICAR)的前身。之后1990年,印第安纳州大学教授詹姆斯·布朗(James Brown)在印第安纳州首府印第安纳波利斯主持举办了第一届计算机辅助新闻峰会。我出版书籍《计算机辅助新闻报道实践指南》的稿费也资助了这次峰会的举办。这本书是第一本探究计算机辅助新闻报道的书籍而现在它已经发行到第四版了。
在90年代至21世纪早期,计算机辅助新闻报道的使用得到了巨大发展,主要原因在于美国调查编辑协会(Investigative Reporters and Editors-IRE)和美国计算机辅助报道协会在密苏里州乃至全世界各地不断举办研讨会。这一系列的研讨会已经是IRE和密苏里新闻学院的联合项目。
IRE官网
21世纪的早些年份,人们见证了全球深度报道网开始发挥着重要的作用,并于2001年在哥本哈根举办了第一届峰会,这届峰会提供了强大的计算机辅助新闻报道的路径和亲手实践的训练机会。
NICAR时代
1994年,NICAR(全国计算机辅助报道协会)正式创办。培训主管詹妮弗·拉斐尔(Jennifer LaFleur)和我雄心勃勃地发起了这个不断壮大的项目,最终这个项目容纳了每年50场峰会的规模。到了1996年,美国的风向成功地拓展到了其他国家,一些国外的记者终于开始在NICAR上成为数据新闻的“新兵”。此外,IRE连同麦考密克基金会在墨西哥城设立了一个在拉丁美洲监督数据训练的项目。
在90年代,美国之外的记者开始疑虑自己是否能够在自己的国家获得数据。这个训练项目为他们展现了怎样将国际或者美国的数据运用到他们的报道中,如何构建起他们自己的数据库以及如何在自己的国家中找到数据。
通过这个项目的努力,1999年时芬兰、瑞士、新西兰、委内瑞拉、阿根廷、荷兰、挪威、巴西、墨西哥、俄罗斯、波斯尼亚和加拿大各国的记者都开始在他们的新闻报道中融入数据分析。
同时,1997年时在伦敦,新闻学教授Milverton Wallace开始举行“NetMedia”年度峰会,在互联网上提供会话和由NICAR和丹麦记者们授课的计算机辅助新闻报道的相关课程。课程函盖了互联网的基础使用、电子表格和数据库管理。许多英国以及欧洲其他国家的记者甚至非洲记者都踊跃地参与了这些课程。
在丹麦曾于1996年在密苏里州参与过训练营的记者Nils Mulvad和Flemming Svith在NICAR的协助下在本国举行了1997和1998年的年度峰会。他们同时出版了一本《丹麦计算机辅助报道手册》,1998年还创建了丹麦国际分析性报道中心(DICAR)。2001年时他们还同IRE 一同组织筹备了第一届全球调查性新闻峰会,同时该峰会也成为了瑞典、挪威、芬兰和荷兰的重要会议之一。
Nils Mulvad
通过全球调查峰会,使用数据的报道手段也很快地传递到东欧。在东欧,曾构建了有计划性的犯罪与腐败报道项目的Drew Sullivan以及罗马尼亚记者Paul Radu成为了强有力的支持者和组织者。
研讨会也通过密苏里大学传递到了中国,透过世界报业协会扩散到了印度。同期,Steve Doig,计算机辅助新闻报道的先驱同时也是现在亚利桑那州立大学计算机辅助报道系的骑士会会长,在全球范围内游历讲授计算机辅助报道。同他一样的NICAR的培训导师还有Jo Craven McGinty, Tom McGinty, Ron Nixon, Andy Lehren 和Sarah Cohen,他们如今都是《纽约时报》或《华尔街日报》的记者。
Steve Doig
数据可视化不断发展
2005年,新闻报道中的数据可视化的应用得到了空前的发展。当时美国的一位程序员Adrian Holovaty创建了一个关于芝加哥犯罪的谷歌聚合内容。这个项目刺激了更多的程序员针对新闻报道进行开发。Holovaty在2007年创建了Every Block,运用了更多本地数据融入到在线地图之中,但是这个项目后来因没有对政府数据的准确性进行更彻底的分析而遭到批评。
Adrian Holovaty
同一年,美国的开放数据运动正式开始,全球许多地区也开始进行了类似的努力。这样的举措增加了全球范围内政府数据的可访问性,虽然这样的需求依然需要通过获得信息法所保障的自由来获取政府并未公布的数据。
到了2009年,越来越多的计算机程序要同新闻业内的程序员组建了hacks/hackers,促进了两个不同职业的人群共享彼此的信息并缓解了两个群体之间的文化冲突。
Aron Pilhofer,《纽约时报》、《卫报》和西北大学新闻学院的Rich Gordon,都纷纷开始推动创建一个人际圈——这群人“对Web或数字应用发展、支持新闻业任务和目的科技创新感兴趣”。同时在硅谷,Burt Herman让记者和科技人员坐在了一起。三方开始创建Hacks/Hackers,最终达成的结果是一个技术日益成熟的新闻编辑室,增加了从网站获取数据的能力,并使得数据更易于管理、可视化和可交互。
另外一个新闻与编程的复合型产物则是对数据的固有缺陷以及确保数据完整性的重新认知。
正如Marcos Vanetta,在《德州论坛报》的Mozilla OpenNews研究员所说:“错误是不可发生的……在软件开发中我们常常可以犯错然后纠正它们,甚至最坏的情况下我们还有备份。但是在新闻中,你不能犯错,你还有声誉需要维系。编辑团队并不能够像开发人员那样习惯失误。”
近年的突破
2009、2010和2011年同样也是数据新闻的突破之年。2009年在加拿大Fred Vallance-Jones 和David McKie出版了一本《计算机辅助报道之全面入门》,其中特别强调了加拿大的计算机辅助报道案例。欧洲的新闻中心开建了数据新闻中心,在全欧范围内组织相关的工作团队,记者Paul Bradshaw成为英国数据新闻公认的先驱。维基解密发布了阿富汗战争笔记及秘密文件还有伊拉克战争笔记,正待全世界的记者来处理这些大量的文本数据。
紧接着2011年,《卫报》刊登的关于城市种族骚乱的系列报道令人印象深刻,同时Journalismfund.eu统筹了第一届“数据收获季”会议(Data Harvest conference)。
英国的新闻调查中心(由Gavin MacFadyen主导)在早期曾参与提供了IRE关于数据新闻的暑期学校课程,而在这个阶段,它在计算机辅助报道领域老将David Donald的协助下继续运行着自己的强有力的项目。
同时在南非的智慧大学(Wits University),Anton Harber 和Margaret Renn大大增加了年度电力会议上的数据会话,同时数据分析已经在亚洲和澳大利亚展开。
到了2015年,经过记者使用数据报道新闻快50年的历程,显而易见的是数据不仅成为了日常新闻的一部分,同时也成为新闻报道的一大驱动力。数据作为报道工具和报道手段的情境还在不断地拓展。
应用电脑工具到新闻报道中发端于社会学研究手段和应用数据统计方法来探究社会问题。但是经过这些年,数据计算已经广泛地拓展到探究典型案例和意外事件,记者们使用电子表格和数据管理工具对直观上并不明显相关的数据集进行相关性分析,使用绘制工具将数据映射到地理环境和社交网络中,实施网络抓取,甚至开始清洗数据,将数据应用到众筹,应用到与受众的交互中,应用到多媒体环境乃至应用到文本挖掘。
关于将数据应用到高质量新闻和各种品牌活动这样的行为应该怎么定义,依然有许多值得讨论之处。但是,无论我们称其为“精确新闻”、“计算机辅助报道”、“数据新闻”、“数据驱动新闻”或是“计算新闻”,好消息是,它将作为新闻的一部分而存在下去。
转自:百度新闻实验室
微信名:
HadoopSummit
微信ID:
hadoopinchina
中国Hadoop技术峰会是亚太地区举办最早、规模最大、影响力最广阔的大数据盛会。
Chinahadoop.com是China Hadoop Summit的内容网站。
HadoopSummit是Chinahadoop.com的微信发布平台。