«Сегодня робот корректирует гранки. Завтра он или другие роботы начнут писать самый текст, искать источники, проверять и перепроверять абзацы, быть может, даже делать заключения и выводы. Что же останется ученому? Только одно – бесплодные размышления на тему, что бы еще такое приказать роботу!», – к этому негодованию профессора социологии Нинхеймера, героя фантастического рассказа А. Азимова «Раб корректуры» [3] (1957) без сомнений присоединятся многие журналисты. Профессор из рассказа не смог сработаться с роботом-редактором EZ-27. А журналисты Forbes – уже привыкли, что программа-робот ведет собственную рубрику [4]. Конечно, речь идет не об андроиде, который набивают на клавиатуре разгромные статьи – под «роботом» чаще понимают программу, алгоритм, который обрабатывает информацию. Есть ли будущее у «робожурналистики»? И насколько велика вероятность, что в ближайшие годы СМИ будут делать выбор в пользу кремниевых репортеров и цифровых редакторов?
«Требуется робот на 0,5 ставки»
Бейсбольный матч между командами двух американских университетов весной 2011 года так и остался бы заурядным событием, если бы заметку [5] о результатах игры не написал… компьютер. Автором стала программа Narrative Science, детище исследователей из Северо-восточного университета в Чикаго. Сервис, который преобразует массивы данных в удобоваримую для человека форму задумывался для работы со статистикой – финансовой, спортивной, медицинской, но оказался востребован и в журналистике. Со временем программа [6] научилась даже делать политический анализ, обрабатывая потоки сообщений в Twitter.
Историческим событием – и в определенном смысле «пиком» карьеры первого «робожурналиста» – стало решение [7] журнала Forbes «рекрутировать» его для подготовки отчетов о финансовом состоянии компаний. Клиентами сервиса стали и спортивный сайт The Big Ten Network и ресурс Pro Publica.
Сооснователь Narrative Science Крис Хаммонд только подлил масла в огонь: в интервью NYT он предсказал [8], что в 2016 году компьютер сможет выиграть Пулитцеровскую премию, а журналу Wired поведал [9] о том, что «более 90%» новостей через 15 лет будут созданы «цифровыми репортерами».
Всю весну 2012 г. медийное сообщество активно обсуждало «вторжение роботов». По мнению [10] российского эксперта Александра Оськина от проб пера компьютера на журналистов «повеяло могильным холодом». Одна за другой выходят статьи с журналах Wired, Atlantic. Специалист по интернет-технологиям Евгений Морозов дает своему материалу [11] провокационный заголовок «Робот украл мою Пулитцеровскую премию!»
Впрочем, слухи о смерти журналистов из плоти и крови оказались преувеличенными (не без участия PR-специалистов, нанятых Narrative Science). Когда Ребекка Гринфилд проанализировала статьи в Forbes, то пришла к выводу [12], что «робожурналистика не пугающа – она просто ужасна». И пусть качество компьютерных текстов действительно хромает, «прецедент Forbes» ознаменовал появление нового типа контента – CGC – computer-generated content, который становится атрибутом нового поколения Web, точно так же как UGC (пользовательский контент) был символом Web 2.0.
Интеллектуальный конвейер: Форд 2.0
Само понятие “робот-журналист” может вызывать сдержанную улыбку или возглас негодования, но игнорировать само явление невозможно. Тем более, что оно – абсолютно закономерно.
В прошлом году Канадская ассоциация журналистов дала несколько определений профессии, одно из которых – “журналистика – это набор методов”. Действительно, с точки зрения технологии, работа журналиста – это определенный алгоритм: сбор, обработка, уточнение (верификация), распространение информации. Жанровая система также предполагает достаточно четкие критерии. Даже заголовки строятся чаще всего по одним моделям – как грамматическим, так и стилистическим. Как тут не вспомнить персонажа романа “Ангелы на кончике иглы”, который писал политические передовицы, комбинируя штампы из выступлений генсеков!.
Действуя по шаблонам, Narrative Science генерирует заметку в 500 знаков всего за несколько секунд. Программа не знает усталости, не просит повысить зарплату, не уходит в декретный отпуск и не отмалчивается на планерках. И это при том, что содержать живых журналистов становится все тяжелее. За последние пять лет число персонала газет в США сократилось на 28%, что повлияло на качество работы СМИ – такие выводы содержатся в докладе The State of the News Media 2013 исследовательского центра Pew. Объявив программу «Качество превыше всего», британский телеканал BBC намерен сократить [13] порядка 2 тысяч сотрудников в течение пяти лет. Канадские ньюсрумы не досчитались [14] тысячи сотрудников в 2012 г. Беларусь не отстает от тенденций: Мининформ планирует сэкономить 800 млн. рублей за счет новых газетных холдингов, а число ведомственных СМИ – уменьшить почти на 40%.
В пучине информации
«Наступление машин» – закономерность еще и потому, что общество становится все сложнее, объемы информации растут – в том числе и социальной. И если раньше лишь ученые и узкие специалисты занимались систематизацией информации (например, реферированием, ведением баз данных), то сегодня это делают и работники массмедиа. Совершенно логичным поэтому стало появление и активное развитие журналистики данных (Data Journalism), в которой акцент делается на систематизации данных, их анализе и визуализации. Признанные медиаэксперты вроде Пола Брэдшоу уделяют журналистике данных все больше внимания [15]. Компьютеры всегда облегчали нам работу с данными. Почему бы не применить их и здесь? Крис Хаммонд считает [16] свои разработки посредником между данными и человеком: «Данные невероятно ценны… но не как таблица с цифрами. Они ценны теми выводами, которые вы можете из них сделать».
Потребность в Data journalism стала еще очевидней в последние годы. Бурные волны общественного мнения, едва заметные струйки слухов, журчащие ручейки дружеских бесед – все они влились в единый трубопровод благодаря «революции Web 2.0». Теперь их можно сохранять и изучать.
«Немногие журналисты имеют время, чтобы искать, обрабатывать и анализировать миллионы твитов», – считает Евгений Морозов. Зато робот-редактор прекрасно «плавает» в океане пользовательского контента – твитов, фото и видеороликов. Симметричный ответ: если просьюмеры и «гражданские журналисты» вооружились новейшими технологиями для создания контента и его распространения, то редакторы используют не менее сложные технологии для его структурирования. Например, «твиттер-газета» TJournal «наняла» Робота Адама, который анализирует русскоязычный сегмент Twitter и отбирает из него самое главное. Как заявляют разработчики, система периодически изучает сообщения твиттерян (исключая спамеров и тех, кто «накручивает» рейтинг), выделяет сообщения, фото, видео, ссылки, отбирает наиболее цитируемые и каталогизирует их.
Не вместо, а вместе
Искусственный интеллект не в силах тягаться с человеком, когда речь идет о стиле или глубине мысли. Но он вполне может составить конкуренцию информационщикам – журналистам, которые готовят новостные заметки, сотрудникам информационных агентств.
Яркий пример [17] – опыт газеты Los Angeles Times. В феврале на сайте издания в полшестого утра появилась заметка о землетрясении в Калифорнии, снабженная картой. Репортер Кен Швенке, чье имя стояло под материалом, мирно спал – текст сгенерировал алгоритм, который заранее написал журналист: робот отслеживал сводки сейсмологов и как только ему попадалась информация о толчках достаточной силы вблизи городов – он давал новости заголовок и публиковал на сайте. ИИ помогает и криминальным репортерам: он изучает статистику, которую присылают полицейские, и ищет «самые интересные» случаи, о которых сообщает журналисту по e-mail.
Сегодня наиболее эффективная стратегия – работа сообща, когда ИИ делает рутинную и ресурсоемкую работу, а человек – творчески интерпретирует отобранную информацию и генерирует новые смыслы.
Портал “Рамблер-Новости”, который провел редизайн в декабре 2012 года, пытается творчески сочетать достоинства искусственного интеллекта и редакторов-людей. Главный редактор Максим Токарев в интервью российскому журналу “Журналист” объяснил, что “сложная лингво-математическая программа” прочитывает каждую новость из более чем 3000 источников, “анализирует эти новости, находит сходные по тематике, склеивает их в тематические сюжеты, разбивает по рубрикам, проставляет региональные метки и т.д.” Люди-редакторы нужны чтобы выставлять приоритеты (целиком автоматизированный Google News вывел новость о смерти Папы Иоанна Павла II с получасовым опозданием в 2005 году) и исправлять ошибки алгоритма.
Редактор Washington Post Стивен Гинсберг предложил сервис [18] Truth Checker – программа делает транскрипт выступлений политиков и сверяет их тезисы с базой данной. Если обнаруживается несоответствие – спикер может лгать. Но право делать выводы остается за журналистом.
Искусственный интеллект и «роботы-журналисты» на нынешнем этапе развития – «умные» инструменты для работников массмедиа, а не конкуренты. На арену выходит новая разновидность журналистики – computational journalism («вычислительная» или «компьютерная» журналистика). По мнению [19] исследователя медиа Никласа Диакополуса, ее особенность – в “применении компьютерной техники и компьютерного мышления в журналистской работе… при сохранении фундаментальных ценностей… таких как точность и проверка фактов». Концептуально computational journalism оформилcя в стенах Технологического института Джорджии в середине 2000-х гг., а в 2012 году в авторитетной Колумбийской школе журналистики для студентов открылся курс [20] Frontiers of computational journalism.
Речь идет об «инвазии» компьютеров в технологический процесс СМИ. Конвергенция приводит к тому, что ближайшим другом журналиста становится не литератор или филолог, а программист и IT-специалист.
Винтокрылые репортеры
В журналистике есть место не только искусственному интеллекту – в ближайшие годы робототехника обещает сильно изменить профессию.
Модное направление – Drone Journalism – это использование беспилотных летательных аппаратов для ведения репортажей из труднодоступных мест. Если репортер XX века, лез в окно, когда его не пускали за порог, то журналист XXI использует для этого беспилотники. Конечно, ушлые репортеры знали, как прикрепить камеру к игрушечным вертолетам и раньше – только сходи в игрушечный магазин.Но речь идет уже не просто о причудах любителей.
В 2011 году в Линкольнском колледже журналистики и массовых коммуникаций штата Небраска появился первый учебный курс, где студентов учат использовать устройства для ведения репортажей и лаборатория [20] Drone Journalism Lab (см. одноименный блог [21]). По словам профессора Билла Аллена, который создал аналогичный курс в университете штата Миссури, будущие журналисты занимаются с радиоуправляемыми дронами, к которым прикреплена камера (себестоимость аппарата – $500-1000). Такие устройства могут помочь репортерам делать снимки с воздуха для подготовки материалов экологической тематики: например, они могут следить за природными бедствиями, лесными пожарами, пишет [22] NY Daily News.
Студентов учат не только управлять дронами – но и не нарушать при этом законы и нормы этики [23]. Появилась даже организация [21] – профессиональное объединение дрон-журналистов (PSDJ) цель которой – «создание этической, образовательной и технологической структуры развивающейся области журналистики».
Если дроны – это день сегодняшний, то полноценные «роботы-журналисты» – дело будущего. Американец Александр Ребен предлагает [24] робота Boxie, которые способен брать у людей интервью и записывать на видеокамеру до шести часов беседы. Но подобные устройства более востребованы в сфере услуг и шоу-бизнесе, чем в журналистике. Например, гиноиды (роботессы) Aiko работают консультантами, развлекают посетителей выставок.
Мечтают ли андроиды о “пулитцере”?
Известная легенда о големе – рукотворном чудовище раввина Лёва, – выполнявшем всю грязную и тяжелую работу для жителлей пражского гетто – прекрасно иллюстрирует место техники в нашей жизни. Алгоритмы, работающие с информацией, – исполнители рутинной и однобразной интеллектуальной работы, неспособные к самостоятельному творчеству. Центонная поэзия «Киберпушкина» Сергея Тетерина – лишь забава и элемент художественных инсталляций, а Narrative Science, как едко указывает Александр Оськин – «унылая и серия продукция» журналистов-зомби, которая «хороша для бухгалтерского или медицинского анализа, но абсолютно никуда не годится для живого человеческого восприятия».
Пока под словом «искусственный интеллект» мы понимает чаще всего интеллект «неестественный» – неполноценный и ограниченный. Но по мере того как когнитивная психология и нейронаука приоткрывают для нас загадки работы нашего собственного разума машины начинают вторгаться в святая святых – творчество.
«Ты разбил мне душу, /сок вечности, /дух моих губ…», – слагает стихи RCIP, программа-поэт, созданная знаменитым изобретателем и футурологом Рэймондом Курцвейлом. Еще недавно описанные американским ученым в книге The Age of Spiritual Machines “одухотворенные” машины, способные к творчеству, казались такой же фантастикой, как его прогноз о превращении в 2045 году всей планеты в единый компьютер. Но в декабре 2012 года Курцвейл получил личное приглашение [25] от руководства Google. Новоиспеченный технический директор будет заниматься разработкой самообучающейся интеллектуальной системы, способной говорить с человеком на одном языке. «Для меня волнительно работать с Google надо одной из самых трудных проблем в компьютерной науки», – написал Курцвейл в блоге.
Мы, очевидно, подходим к моменту, когда сама концепция техники нуждается в пересмотре. Техника – это всегда инструмент, будь то stilo римлянина для ведения записей на вощеной дощечке или стилус современного европейца для работы с сенсорным экраном смарфтона. Сервисы вроде Narrative Science будоражат воображение – ведь они решают задачи в области творчества. Но они еще не занимаются творчеством. Как только техника сможет генерировать нечто действительно новое, оригинальное – тогда она лишится своего инструментального статуса и возникнет целый ворох этических проблем. Ведь если робот в рассказе Азимова решил «выправить» книгу, изменив ее смысл, что помешает сделать то же самое с передовицей какой-нибудь Narrative Science версии 10.0?
