Открытые данные в Беларуси – звучит странно. Во-первых, мало кто знает, что вообще стоит за этими словами. Во-вторых, у тех, кто все-таки в курсе, это словосочетание вызывает приступ здорового сарказма.
Тем не менее, есть сообщество, которое создает белорусскую платформу открытых данных и хочет, чтобы это стало началом нового отношения к информации в нашей стране.
Волонтеры вместо государства
Открытые данные (open data) – это общественно полезные данные в машиночитаемом виде [3]. Их можно свободно использовать, распространять, получать новые смыслы, анализируя их и сопоставляя с другими. Это не государственные секреты, не коммерческие тайны и не персональные данные о том, сколько раз вы ходили в этом году к стоматологу.
На основе открытых данных можно создать карту доступности метро [4], которой смогут пользоваться все горожане. Или вэб-приложение о скидках в городе (в Минске такое не было разработано, потому что торговые сети не согласились на централизованный сбор информации). Сориентироваться [5], куда лучше сдать отходы на переработку или найти другого хозяина ненужных вам вещей. Даже заблокированный [6] в Германии сервис онлайн-вызова такси Uber является примером использования открытых данных. И за одно примером того, что всегда могут найтись те, кто против.
Главный владелец и поставщик данных, которые подпадают под это определение, - государство. Именно оно часто создает платформы, чтобы собирать информацию своих служб в одном месте и в удобной форме. Это могут быть национальные порталы (как в Чехии [7] или Канаде [8]), городские (как у Лондона [9] или Москвы [10], последний кстати во многом удобнее национального [11]) или даже общеконтинентальные, как африканский [12] (он, правда, создан при поддержке African Development Bank Group, а не правительств). Есть и другие владельцы данных - бизнес, международные организации или сами граждане.
У Беларуси традиционно свой, особый, путь, а именно – платформа открытых данных [13] у нас создается группой волонтеров. Идея спонтанно возникла около года назад во время одного из мероприятий сообщества Hack for Future [14]. Кампания из программистов и журналистов хотела сделать карту пожаров в Минске на основе данных МЧС, но оказалось, что данные нужно буквально собирать вручную.
«Мы несколько раз сталкивались с подобной проблемой, и стало понятно, что нужно с этим что-то делать в глобальном смысле, – говорит один из инициаторов проекта Игорь Кандыба. – Когда начали работать, оказалось, что кроме поиска самих данных есть огромное количество вопросов [15]: что годиться к размещению на платформе, какими должны быть правила оформления наборов и форматы данных».
Изначально команда насчитывала всего несколько человек, но на Международный день открытых данных [16] в эти выходные собралось уже два десятка заинтересованных – от преподавателя Института журналистики БГУ до программиста, который помогает обрабатывать данные жене-медику.
Сообщество регулярно проводит открытые лаборатории, активно в сети [17] и постепенно налаживает контакты с госорганами. «Мы не пытаемся в очередной раз обругать чиновников, – журналист Алексей Медвецкий был автором идеи карты пожаров Минска [18], с которой все и началось, – с МЧС, например, мы постепенно начинаем активнее работать, потому что они видят, что мы настоены серьезно и просто хотим помочь».
Белстат тоже знает об открытых данных и, кажется, не против двигаться в этом направлении. В прошлом году состоялось два заседания статистического пресс-клуба [19], на котором были и активисты opendata.by. Но кадровые перестановки [20] могут внести свои коррективы в процесс: после них ни одного собрания пока не было.
Понятно, что хотя на платформе уже собрано какое-то количество наборов данных (dataset), дело даже не на старте. И главная причина – отсутствие инфраструктуры и культуры потребления данных.
Данные и закон
Белорусское законодательство не предъявляет требований к тому, в какой форме госорганами должна представляться информация. Кроме Конституции, которую даже в судах не всегда воспринимают как нечто, приложимое к практике, отношение к информации определяет Закон об авторском праве и смежных правах [21] и Закон Об информации, информатизации и защите информации [22]. Ни в одном из них не говорится о формате, в котором чиновники обязаны предоставлять информацию. Как нет и норм относительно того, что у сайта, например, горисполкома должен быть технически подготовленный штат, а не секретарь или лаборант, которого заставляют еще и новости на сайт вешать.
Что касается авторского права, то только в одном случае о нем думать не нужно – когда мы пользуемся государственными источниками информации.
«Все базы данных я бы разделила на 2 группы: те, что охраняются авторским правом, и те, что не охраняются. Ключевой момент – был ли приложен творческий труд для того, чтобы сведения собрать или расположить определенным образом, – объясняет кандидат юридических наук Диана Иванова. – Базы данных, предоставляемые государственными органами, не охраняются авторским правом».
Формат, о котором не думает никто. Или почти никто
Машиночитаемость важна для того, чтобы можно было обрабатывать информацию не вручную, а с помощью разнообразных сервисов. Возьмем, работу Вадима Шмыгова (TUT.BY) – Все автомобили белорусов [23]. Пришлось отсканировать сборник МВД, распознать PDF, собрать таблицы с данными вручную и только после этого приступить к созданию инфографики с помощью Tableau [24]. А ведь процесс подготовки мог ограничиться скачиванием CSV-документа с сайта МВД.

На сайте TUT.BY инфографика [23] доступна в интерактивном виде
«После того, как вышла эта инфографика, мне позвонил один из читатетей, который занимается автомобильным бизнесом, и радостно сказал, что я сделал ему план по продажам. Даже хотел дать денег», - рассказавает инфографик.
А, например, Гидромедцентр дает информацию [25] в нужном формате, зато по платной подписке, что сразу же выводит данные из категории «открытые».
Открытые данные для Беларуси '2014 [26] from ushchent [27]
При всей пассивности белорусского государства в области открытых данных, оно и у нас является основным поставщиком данных. Остальная часть общества или не знает, что данные, которыми она владеет, может быть полезны для всех (граждане), или боится потерять прибыли (бизнес).
«Мы работаем с розничной торговлей и пока я не вижу никаких предпосылок к тому, что они готовы раскрываться и делиться информацией, даже если она не представляет коммерческой тайны», - делится опытом начальник отдела одной из исследовательских компаний Валентин Соколовский.
Очень мало опыта сбора данных путем краудсорсинга и уж совсем непонятно, как.
Справедливости ради нужно сказать, что мы не единственная страна, для которой открытые данные - терра инкогнита. Бум интереса к данным пришел 2-3 года назад. Мир только в последние несколько лет осознал, что без умения работать с данными уже не обойтись ни в одной сфере жизни - от экономики до медицины и искусства. И теперь учится [28] ими управлять.
