Термин "журналистика данных" сейчас у многих на слуху – по крайней мере, в таких развивающихся странах, как Пакистан. Благодаря инициативам, включающим открытое правительство [3], открытые данные [4], закон о праве на получение информации [5] (RTI) и закон солнечного света [6], в развивающихся странах граждане получают все больше доступа к данным.
Существует также широкий спектр бесплатных, простых в использовании онлайн-инструментов для работы с наборами данных, позволяющих по-новому рассказывать истории. Они открывают ранее недоступные возможности для журналистов даже в таких местах, где у редакций нет ресурсов или желания для создания больших команд, работающих в журналистике данных. Все, что нам нужно сделать, – это научиться использовать эти инструменты.
Что такое журналистика данных?
Одно из моих любимых определений журналистики данных принадлежит редактору данных Google Саймону Роджерсу [7], который написал [8]: "Журналистика данных – это способ использования чисел для того, чтобы как можно лучше рассказывать истории. Она не имеет отношения к математике или рисованию графиков или даже к написанию кода. Она, прежде всего, относится к историям – и математика, и графики, и код – все служит этой цели".
Понимание этого в большой степени способствует снятию нерешительности и страха, которые некоторые журналисты испытывают, впервые приступая к работе над материалом в жанре журналистики данных. Конечно, для работы над некоторыми журналистскими проектами, использующими большие наборы данных, нужны команды, состоящие из нескольких человек: журналистов, разработчиков и программистов. Но и один журналист может довольно много сделать, используя простой анализ данных, чтобы по-новому рассказать историю. Безусловно, мы видим и очень сложные материалы в жанре журналистики данных, но это не должно пугать новичков. В конце концов, речь идет о придании данным значения и о возможности рассказать историю, стоящую за цифрами.
Поиск и извлечение данных
Несмотря на принятие закона о праве на получение информации и на возможность получения большей информации о деятельности правительств, доступ к данным остается проблемой для журналистов. Часто онлайн-данные хранятся, например, в PDF-файлах, и журналистам трудно получить к ним доступ. Но технологии помогают нам конвертировать такие файлы в электронные таблицы.
Одно из самых простых мест, с которого можно начать поиск наборов данных, – это статистический офис [9] Организации Объединенных Наций по вопросам образования, науки и культуры (ЮНЕСКО). Вы можете загружать наборы данных по разным странам [10] или по четырем основным темам – образование [11], наука и инновации [12], культура [13] и коммуникации [14].
Для извлечения данных из PDF-файлов и перевода их в форматы CSV и Excel можно использовать хороший бесплатный инструмент Tabula [15]. Другой бесплатный инструмент Online OCR [16] может также извлекать текст из PDF-файлов и конвертировать данные в форматы Excel и Word. Инструмент распознает до 46 языков (полный список языков можно найти здесь [17]).
Не стоит недооценивать силу Excel
Несмотря на появление множества других инструментов, Microsoft Excel остается мощным средством для анализа и визуализации данных. В Интернете можно найти полезные бесплатные обучающие материалы, например, этот [18] (или этот [19]), которые помогут начинающим журналистам данных научиться сортировать и фильтровать наборы данных и сводить их в общие таблицы. Люди, отдающие предпочтение видео, могут также найти бесплатные видеоуроки [20]. Будьте терпеливы к себе и получайте удовольствие от поиска новой информации и обучения. Золотое правило гласит: начинайте с малого.
Визуализация данных и сторителлинг
В дополнение к сортировке и фильтрации наборов данных, журналисты могут использовать визуализацию для выявления ранее незаметных тенденций и закономерностей, скрытых в цифрах. Excel позволяет создавать простые визуализации, но существует много других бесплатных инструментов, которые можно использовать, работая над журналистскими материалами.
Один из таких инструментов – необыкновенно простой сервис для графического дизайна Canva [21]. Для его использования не нужно иметь опыт в графическом дизайне. Google Fusion Tables [22] – также удивительное и простое в использовании приложение для визуализации данных, оно хорошо подходит для начинающих, так же, как и Infogr.am [23]. Pixel Map [24] – еще одно приложение, которое подходит для журналистов онлайновых и печатных медиа.
Мы используем эти инструменты, чтобы представить аудитории привлекательные и интересные истории. Всегда имейте в виду, что основы журналистики остаются теми же, независимо от того, используете ли вы данные.
Другие советы
Другой способ получить навыки в журналистике данных – посещение бесплатных Массовых открытых онлайн-курсов (MOOC [25]), которые предлагают различные организации. Кроме того, Глобальная сеть расследовательской журналистики [26] (GIJN) предлагает список ресурсов по журналистике данных.
И обратите внимание на этот справочник по журналистике данных [27].
Халид Хаттак для Международной журналистской сети [28]
