월드와이드웹을 개발해 인터넷의 아버지라고 불리는 팀 버너스리는 저널리즘의 미래가 데이터를 분석하는 데 있다며 이젠 저널리스트들이 데이터를 잘 다룰 줄 알아야(data-savvy) 한다고 말했다. 저널리스트들이 방대한 규모의 데이터를 수집하고 분석한 후 독자들에게 제공해 쉽게 활용할 수 있게 만드는 것이 데이터 저널리즘(Data Journalism)이다. 데이터 저널리즘은 2010년부터 해외에서 화두가 되며 저널리즘의 중요한 형태로 자리를 잡고 있다. 이를 제일 먼저 받아들인 유력지 중 하나가 바로 영국의 <가디언>이다. <가디언>은 2009년 5월부터 ‘데이터 블로그(datablog)’를 시작했다.

영국의 <가디언(The Guardian)>과 데이터 저널리즘

1821년 창간된 영국의 일간지 <가디언(The Guardian)>. 현재 진보 성향의 대표적인 영국 유력지 중 하나다. 2013년 에드워드 스노든의 미국국가안보군(NSA)의 전방위적인 도청 및 해킹 사건과 프리즘(PRISM)이라는 비밀정보수집 프로그램 내부고발 사건을 가디언지가 적극적으로 폭로하면서 퓰리처상을 받았다. 2월엔 ‘2014 영국 언론상(British Press Awards)’에서 정부 감시에 관한 보도로 올해의 신문상을 받았다. 현재 유력 신문사 가운데선 유일하게 아직까지 인터넷 기사를 무료로 제공하고 있다. 덕분인지 사람들이 세계에서 세 번째로 많이 읽고 있는 웹사이트(theguardian.com/uk)를 가지고 있고(2012년 기준), 영국에서 <데일리 텔레그래프>와 <타임즈>에 이어 세 번째로 많이 읽히는 신문이다(2009년 기준).

이 <가디언>지가 가장 먼저 사용하고 있는 저널리즘 방식이 데이터 저널리즘이다. <가디언>은 현재 인터넷 사이트 뉴스 카테고리에 ‘데이터’란을 만들어 ‘데이터 스토어(data store)’와 ‘데이터 블로그(data blog)’등의 데이터 관련 항목을 운영하고 있다. 모든 자료는 무료로 제공된다. 데이터 스토어의 목표는 중요한 정보에 대한 접근성을 높이는 데 있다. 스토어는 구글의 스프레드 시트(spread sheet)를 이용해 사용자들이 정보를 쉽게 추출하고 저장할 수 있게 만들었다. 블로그에선 매일 방대한 데이터 속에서 신뢰도가 높은 정보를 검증해 모두에게 공개한다. 영국뿐만 아니라 전 세계의 수많은 기업과 기관에서 <가디언>의 데이터를 소스로 활용하고 있다. 데이터는 주제를 가리지 않는다. ‘영국에서 재정문제가 가장 심각한 지역은?’부터 ‘무신론자가 가장 많이 사는 곳은?’까지 다양한 영역을 다룬다.

사이먼 로져스는 <가디언>의 전 데이터 편집자이자, 가디언의 데이터 저널리즘을 시작한 사람이다. 그러나 그는 이 개념이 새로운 것이 아니라 이전부터 존재해왔다고 말한다. 그는 <가디언>의 창간호부터 데이터 저널리즘을 차용했다고 설명한다. 1821년 5월 5일 호에 실린 맨채스터와 샐포드의 학교 목록 정보가 그것이다. 학교에 다니는 학생의 수와 공교육을 받고 있는 학생의 수, 평균 교육비 등의 정보를 지면에 실었다. 이러한 정보는 그 당시엔 큰 반향을 일으켰다. 공교육을 받고 있는 학생수가 8,000명이라는 정부의 집계 자료와 달리, 실제론 25,000명에 가까웠기 때문이다. 로져스는 <가디언>의 데이터가 잘못된 정보에 가려졌던 진짜 현실을 보여줬다고 말한다.

당시 <가디언>에 이 정보를 제공한 자는 ‘NH’로 알려진 비공개 취재원이었다. NH는 정보를 제공한 이유를 분명히 밝혔다. 그는 ‘정보는 언제나 가치가 있다. 우리가 모르는 사이에 사회의 현재 상태와 미래 발전에 관한 가장 좋은 의견들이 잘못된 정보에 기초할 수도 있기 때문이다’ 라고 말했다. 다시 말해 사회가 발전하기 위해선 현 상태를 정확하게 알아야한다는 소리다. 로져스는 이를 데이터를 이용해 더 나은 교육 시스템을 만드는 것’이라고 표현한다.

<가디언>의 데이터는 점점 규모가 커지고 있다. 인터넷에서는 누구나 데이터를 출판할 수 있을 뿐만 아니라, 데이터를 가공하고 이미지화할 수 있는 무료 도구들이 넘쳐나기 때문이다. <가디언>은 데이터 저널리즘에 독자들을 적극적으로 끌어들이고 그들로 하여금 참여하라고 권유한다. 독자들이 편집하고 이미지화한 데이터들은 데이터 스토어에 출판한다. 데이터 저널리즘은 모두에게 ‘열린 저널리즘(Open Journalism)’이어야 한다는 것, 뉴스를 만드는 일에 독자들을 참여시키는 것은 가디언이 독자와의 소통을 통해 데이터의 신뢰도를 더욱 강화하고 있음을 보여준다. 완벽하게 날 것 그대로의(raw) 데이터를 제공하는 것도 그 때문이다. 독자에게 모든 정보를 공유하고 협업을 통해 더 나은 저널리즘을 만드는 힘. <가디언>의 편집국장 앨런 루스브리저는 이 모든 것을 ‘정보의 자유화(free the facts)’라고 표현한다. ‘팩트는 신성하다(Facts are sacred)’는 것이 <가디언>의 모토다.

<뉴스타파>와 데이터 저널리즘

<가디언>, <프로퍼블리카(propublica.org)>나 <뉴욕타임스(nytimes.com)>같은 해외 유력 언론들이 오래전부터 데이터 저널리즘에 주목해왔다면, 한국 방송에선 <뉴스타파>가 처음으로 이를 시도했다고 볼 수 있다. 해직 언론인들이 모여 만든 <뉴스타파>는 2013년 3월 1일 첫 방송을 한 시즌3부터 데이터 저널리즘 탐사 프로젝트를 시작했다. 최승호 PD는 ‘데이터 저널리즘이란 기본 데이터를 홈페이지에 올려놓으면 시민이 직접 검색해 중요한 사실을 찾아낼 수 있도록 하는 것’이라고 말한다. <뉴스타파>는 기본 정보를 제공할 뿐 그 속에서 의미를 찾아내는 주체는 시민이라는 얘기다.

세밀한 데이터를 온라인 상에서 제공하는 만큼 독자가 원하는 정보를 찾을 수 있게 표나 그래프의 형태로 선보이는 것이 효과적이다. 2013년 <뉴스타파>는 첫 데이터 저널리즘 프로젝트로 박근혜 정부 초기 내각 정보를 그래픽으로 제공했다. 정보를 제공하는 이유로 ‘고위 공직 후보자들이 국가를 이끌 역량과 자질을 갖춘 인물인지 판단하려면 이들에 대한 자세한 정보가 국민들에게 제공되어야 한다고 생각하기 때문이다. 고위공직자들의 정보를 연령, 재산, 예금 등의 항목별로 나누어 그래프로 제공해 한눈에 파악할 수 있게 했다. 또 같은 해 5월 조세피난처에 회사를 설립한 한국인의 명단을 발표해 사회적으로 큰 반향을 일으켰다.

현재 <뉴스타파> 홈페이지의 메뉴는 ‘데이터’ 카테고리를 포함하고 있다. 또 단순 데이터를 보여주는 데 그치지 않고 <뉴스타파>가 직접 정보를 분석해주기도 한다. <뉴스타파>는 지난 6·4지방선거를 맞아 전국 지자체의 재정 건전성을 평가해 표로 공개했다. 지자체 별로 재정의 규모와 상황이 다른 것을 감안해 변화 정도를 측량하고 등급을 매겼다. 평가 방법도 상세히 보여줘 신뢰도를 높였다.

데이터 저널리즘 시대

데이터 저널리즘은 누구나 참여할 수 있다는 것이 핵심이다. 굳이 그래프나 이미지의 형식으로 보여주지 않고 글로써 혹은 숫자로 보여줘도 된다. 그만큼 다양한 형식이 가능하다. 다만 기본적으로 숫자와 통계 등의 정보에 기초하고, 그 속에서 끌어낼 수 있는 이야기에 집중해야 한다. 그러나 아직 우리나라에선 그 개념이 익숙하지 않고 유력지들 또한 이를 적극적으로 받아들이고 있지 않다. 가장 적극적으로 데이터 저널리즘을 차용하고 있는 <뉴스타파> 또한 데이터를 이용한 탐사보도에 중점을 두고 있지만 아직 그 규모가 작다. <뉴스타파>의 데이터저널리즘연구소장 겸 리서치 디렉터인 권혜진 박사는 연합뉴스와의 인터뷰에서 <뉴스타파>같이 비영리 독립 매체에서 시도하지 못하는 주제를 예산과 인력을 투입할 수 있는 영리 매체에서 다뤄야 한다고 말했다. 전 세계 추세로 보아 한국 언론계가 언제까지나 데이터 저널리즘의 도입을 외면하고 있을 수는 없다. 정부의 공공데이터 개방 또한 서서히 늘어나고 있음에 따라 이를 제대로 활용할 수 있도록 데이터 저널리즘의 제고가 필요한 시점이다.

저작권자 © 스토리오브서울 무단전재 및 재배포 금지