«Журналистика данных», давно распространившаяся на Западе, пока не получила такого же признания в странах бывшего СССР. Причин тому несколько, главные из них – неумение отечественных журналистов работать с «сырыми» цифрами и чрезмерная закрытость как государственных ведомств, так и частного бизнеса. Однако есть и другая опасность – редакция или автор, увлекшись технологиями «журналистики данных», могут невольно исказить реальную картину. Такое происходит, когда данные рассматриваются в отрыве от контекста, к которому они относятся.
«Советские журналисты, воспитанные в духе коммунистической партийности, активно участвуют в общественно-политической и культурной жизни страны, осуществлении решений XXIV съезда КПСС. Партия высоко ценит вклад советских журналистов в строительство коммунизма, видит в них своих надежных помощников» (с) Константин Черненко, «Справочник партийного работника». Я не случайно вынес эту цитату в начало. Во времена СССР журналистика рассматривалась как некая смесь литературного творчества и госпропаганды. Классикой жанра считались очерки Василия Пескова [3], в самом деле бесподобные – на сборнике «Отечество» выросло не одно поколение журналистов.
Советской журналистике в числе прочего придавались такие функции, как воспитательная и пропагандистская, а вот «копание в цифрах», наоборот, не поощрялось – это дело Госстата, чтобы воспевать строительство коммунизма, цифры не нужны. А свежие данные по росту безработицы в США и закрытии шахт в Великобритании всегда можно было получить в местном райкоме партии.
К сожалению, подобный подход перекочевал и на журфак БГУ постсоветской Беларуси: там учат писать, но не работать с данными. Спрашиваешь выпускника журфака: «Статистику изучали?» – «Нет» – «Математический анализ изучали?» – «Нет» – «Экономику изучали?» – «Проходили, но я ничего не помню» (реальная беседа с одним из постоянных авторов «Медиакритики»). В результате мы получаем журналистов, которые могут блестяще описать горемыканья многодетной семьи, которой райисполком никак не выделит положенное жилье. Но тот же журналист будет путать понятия «прибыль» и «выручка», и никогда в жизни не объяснит, чем проценты отличаются от процентных пунктов.
Печально, но в результате для него оказывается закрыт целый огромный пласт журналистики – то, что на Западе называется data journalism, а по-русски – «журналистика данных».
Приблизить цифры к людям
Согласно наиболее распространенному определению [4], «журналистика данных» – жанр журналистики, использующий для предоставления информации открытые данные и другие общедоступные данные. Данные могут касаться абсолютно любой сферы жизни: экономика, политика, наука, образование и многое другое. Это может быть информация о росте инфляции или государственного долга за определенный промежуток времени, статистика совершаемых преступлений в том или ином регионе, процент поступивших в вузы или среднегодовое изменение русла реки. К данным добавляются традиционные для журналистского арсенала средства: печатный текст, фотографии и тому подобное. Таким образом, сложные для восприятия в своем обычном виде данные, цифры и факты становятся понятными и простыми для аудитории.
«Представление о том, что читатель – дурак, иногда бывает полезным. В том смысле, что читатель не должен трудиться, когда он читает газету. Каким бы умным и сложным ни было то, что ты пишешь, оно должно быть представлено в максимально легкой для восприятия форме», – говорит [5] Максим Ковальский, в 1999-2011 годах – главный редактор журнала «Коммерсантъ-Власть».
Именно по той причине, что задача журналистики данных – «сделать цифры понятными», чаще всего результат работы журналиста иллюстрируется с использованием инфографики. Более того, сам по себе журналистский материал может быть представлен в виде интерактивной инфографики. И тогда это уже не публикация в СМИ, это нечто иное. Вот пример [6] подобной – именно журналистской – работы.
Итак, в основе журналистики данных лежат цифры: материал строится не вокруг новостного повода, а вокруг статистики, цифр, сводок, отчетов и прочей справочной информации. Хотя, конечно, очень во многих случаях инфоповод все равно нужен. Например, когда в конце года принимается госбюджет, это хороший повод покопаться в цифрах государственных доходов и расходов. А вот в июле вы вряд ли кого-то заинтересуете анализом госбюджета.
Важно понимать, что в журналистике данных [7] текст – это не основной инструмент, а вспомогательный. Соответственно, меняется и форма подачи материалов. Цифровую информацию достаточно сложно сделать эмоциональной, но при этом она может быть намного более наглядной. И тут уже многое зависит от таланта автора инфографики: благодаря его усилиям один список или одна картинка, один график могут быть куда более наглядными чем тысячи слов.
Я не случайно упомянул что пока о журналистике данных как о полноценном жанре можно говорить только в Европе и США – именно там она получила большое распространение и признание. Дело в том, что data journalism как явление – во многом порождение открытого общества, в котором ни государственные ведомства, ни бизнес-структуры не стараются засекретить все и вся, где не привыкли задавать знаменитый советский вопрос: «А вы с какой целью интересуетесь?».
Там, где журналисты имеют доступ к большим объемам «сырых» статистических и иных данных, собственно, и зарождается журналистика данных. Когда журналист владеет хотя бы основными навыками статистического анализа [8], цифры начинают говорить сами за себя, рассказывать историю. Государственные контракты, бюджет, региональная статистика, биржевые индикаторы – между всем этим всегда существует взаимосвязь, не очевидная, но порой очень значимая.
Например, в США журналистика данных как самостоятельный жанр зародилась в годы войны во Вьетнаме. Тогда (во многом на волне антивоенных настроений) американские журналисты начали глубоко копаться в бюджете Пентагона, обнаруживая несоответствие заявленного бюджета и расходов по госзакупкам. Позднее такая практика распространилась и на другие государственные ведомства. Со временем в Штатах появилось множество организаций и фондов, которые финансируют проекты в сфере data journalism, и подобный подход стал нормальной частью журналистской деятельности.
Тут интересен еще один момент. Немалый вклад в развитие журналистики данных в США внесли… уфологи и приверженцы разнообразных «теорий заговора». Первые буквально перелопатили бюджет оборонного ведомства и прочих федеральных служб в поисках скрытых статей финансирования, связанных с исследованием инопланетян и постройкой всякой техники на основе инопланетных технологий. Инопланетян не нашли, зато отыскалось много всего интересного вполне земного происхождения.
То же самое – и сторонники теорий заговора. Это они искали скрытые финансовые рычаги Бильдельбергского клуба и каналы финансирования рептилоидов в правительстве США, а в итоге выявили корпоративные мошенничества, что стало причиной одного из самых громких банкротств (https://ru.wikipedia.org/wiki/Enron [9]) в американской истории.
Однако сегодня журналистика данных в США и Европе развивается немного по иному пути. Приоритет делается на решение социальных проблем, для чего, например, используются данные переписи населения. Специальный сервис позволяет щелкнуть мышью [10] на любой район определенного города, чтобы получить информацию по этническому составу, рождаемости и смертности в разные годы.
Ловушки журналистики данных
Расцвет журналистики данных в тех же США и Европе уже к началу 1990-х сделал очень острой проблему непредвзятости: результаты анализа даже самой надежной статистики и самых качественных исследований могут быть ошибочно интерпретированы или искажены, когда дело доходит до выводов и рекомендаций. Более того, даже сам по себе подбор исходных данных для журналистского исследования оказывается не нейтральным по умолчанию процессом, поскольку требует явных редакционных решений. То есть в журналистике данных всегда надо проводить четкую границу между анализом и мнениями. Например, в газете The New York Times этим занимается специальный человек – редактор по стандартам Филип Корбетт.
В свою очередь, профессиональное издание «Мы и Жо» приводит мнение [11] редактора блога о журналистике данных Ampp3d Мартин Белам, который настаивает на необходимости как представлять точные данные, так и давать им интерпретацию, которая не обязательно должна быть нейтральной – она может делаться «с чувством, как человеческая история».
Для повышения «внешней» достоверности журналистики данных такие сайты, как ProPublica и другие ему подобные, всегда приводят ссылки на источники исходных данных, чтобы читатели могли сами оценить их качество. С другой стороны, многим «журналистам цифр» удалось преуспеть именно потому, что аудитории была интересна именно их интерпретация статистики. В итоге получается, что журналистика данных усиливает привычные редакционные стандарты: аудитория ждет от нее одновременно прозрачности источников данных, более разговорного тона и качественных, сильных выводов.
Но вот с выводами бывают проблемы. Особенно в условиях закрытости для общества решений государственных и муниципальных структур. Я сам когда-то долгое время как экономический обозреватель освещал ситуацию на рынке недвижимости Минска. И однажды, где-то в 2004 году, анализируя квартирный рынок Фрунзенского района, пришел к выводу о полной бесперспективности Кунцевщины. Я оперировал цифрами – предложениями по разным типам квартир и домов, привязывал эти данные к карте города и новостройкам, и т.д. Но я тогда и понятия не имел, что архитекторы «Минскпроекта» уже приступили к проектированию района «Каменная Горка». И что уже с 2008 года ситуация с квартирами там в корне изменится.
Именно по той причине, что интерпретировать полученные данные следует особенно тщательно, обычно в штате крупнейших международных деловых газет, вроде Financial Times, нет ни одного человека, чья должность звучала бы как «журналист по работе с данными». Над проектами, связанными с обработкой больших массивов информации, работают сборные коллективы. Обычно в рабочую группу входят специальный корреспондент, знакомый с изучаемой проблемой, пишущий журналист, специалист по интерактивной графике, дизайнер, а иногда и программист. Такие рабочие группы плотно взаимодействуют со службой новостей, чтобы их члены были в курсе оперативных событий.
Пара цитат
Здесь будет вполне уместно привести несколько цитат журналистов, работающих в сфере журналистики данных в России.
Иван Бегтин, директор некоммерческого партнерства «Информационная культура»:
- Иногда журналистика данных – это журналистика без журналистики в традиционном понимании этого слова. Начало развития журналистики данных в России стало следствием тенденции к открытости данных, в первую очередь – государственных. Следующим шагом со стороны государства должно стать представление данных не просто в открытом доступе, но и в удобном для обработки виде. Когда какой-то бюджет доступен просто на бумажке – это одна история, а когда хотя бы в Excel-файле, и его можно загрузить, проанализировать, построить самостоятельный график – совсем другая. В данном случае речь идет о совершенно другом качестве работы с информацией. Это все имеет ценность как для национальной экономики знаний, так и для жесткого общественного контроля.
Виталий Лейбин, главный редактор «Русского репортера»:
- В России вообще растет интерес к фактуре, к реальности, а не к «большим идеям», вынутым из головы, как шар. Проблема современного мира – это не недостаток данных, а их избыток. Умение их анализировать является одним из самых востребованных. Новый жанр открывает и новые возможности для изданий: иногда можно не бегать по полям, а просто внимательно анализировать, скажем, сайты госзакупок и прочие данные. Аудитории нужен журналист (или аналитик, или ученый), чтобы увидеть хоть что-то значимое посреди нарастающего шума информации.
Инструменты для журналистики данных
Медиа-специалист, желающий работать в сфере журналистики данных, должен уметь работать с целым рядом аналитических и технических инструментов: начиная с распространенных Excel, Google Docs и заканчивая более специфическими, вроде IBM ManyEyes, Wordle или Planning Tools от Google, или даже OfficeReports. Но, к сожалению, в Беларуси пока немногие журналисты имеют навыки работы с этими инструментами.
Wordle [12]
Wordle – это сервис по созданию «карт текста». Пользователь загружает туда документ, а Wordle подсчитывает частоту упоминаемости слов и наглядно отображает их в виде инфографики.
IBM ManyEyes [13]
IBM ManyEyes – это сервис визуализации данных в форме различных графиков, наложения их на карты (мира или США) и построения ряда редких и наглядных графиков вроде Bubble Chart. Вот хороший пример:
Document Cloud [14]
Это созданный Thomson Reuters инструмент, позволяющий анализировать миллионы исходных документов с данными, находя в них неочевидные взаимосвязи.
Zemanta [15]
Инструмент, использующий технологии semantic web. Полезен преде всего для блогеров и SEOшников.
Gapminder Desktop [16]
Программа для визуализации статистической информации, использующая анимацию.
Tableau [17]
Облегчает сбор, визуализацию и анализ любых данных, уменьшая трудоемкость аналитических процессов и экономя время. Tableau позволяет делать более точные выводы и прогнозы, не прибегая к сложным аналитическим инструментам, чтобы составить полноценные отчеты, визуализацию данных, интерактивное их отображение.
Проекты в сфере журналистики данных
The New York Times [18]
Guardian Datablog [19]
Financial Times [20]
Open Data blog ZeitOnline [21]
Каталоги открытых данных
Data.gov (US) [23]
Data.gov.uk (UK) [24]
Worldbank, Data [25]
Scraperwiki [26]
Open Knowledge Foundation [27]
Визуализация данных
Visual Complexity [28]
Flowing Data [29]
Well-formed Data [30]
Good Magazine [32]
A Beautiful WWW [34]
Infografistas [35]
Visual Editors [36]
Cool Infographics [36]
