Восстание машин. Роботы-журналисты захватывают СМИ

Андрей Мирошниченко

Кибер-журналист против био-журналиста: пока ничья

В мае 2015 года Скотт Хорсли (Scott Horsley), корреспондент NPR в Белом доме и бывший бизнес-журналист, бросил дерзкий вызов пишущему алгоритму Wordsmith компании Automated Insights. «Мы хотели узнать, – пишет NPR , – как наше лучшее перо покажет себя против машины». Поскольку NPR – радио, то био-журналист был достаточно тренирован для быстрого письма. По условиям соревнования, оба противника должны были дождаться публикации финансового отчета сети кафе Denny’s и – вперед. Причем у Скота было преимущество – ведь он был постоянным клиентом Denny’s. У него там даже была любимая официантка, Женевьев, которая знала наизусть его заказ: сэндвич из яичницы с беконом. Не помогло. Хотя… как судить.

Робот управился за две минуты, Скот Хорсли – за семь с небольшим. NPR публикует обе заметки и предлагает читателю своего рода тест Тьюринга – определить, какой текст сгенерирован роботом, а какой – человеком.

Робот написал, конечно же, левую заметку. В ней очевидно выше плотность цифр, и она суше по стилю. Тогда как Скот, вспомнив то ли меню, то ли Женевьев, подпустил немного необязательной для финансового отчета лирики. Например, вставил фразу: «Рост продаж показывает, что потребители не прочь раскрыть свои бумажники ради блинчиков, яиц и картофельных оладий».

Формально словарь робота больше, поскольку должен включать в себя весь словарный запас языка (это свыше 1 млн слов для английского языка). Словарь образованного англоговорящего человека может достигать 100 тысяч слов. Но робот должен использовать наиболее частотные слова, что и делает его язык «суше». Кроме того, словарь этого робота ограничен еще и финансовой специализацией. Ему и «в голову» не могло прийти, что можно использовать в финансовом отчете кулинарные или спортивные названия (grand slam). Человек же, наоборот, частотностью не ограничен и волен использовать сколь угодно редкие и вычурные слова, расширяя контекст и образность. Более того, человек-писатель потому и писатель, что использует оригинальные образы. Роботу для финансового отчета это просто не нужно.

“But that could change”, это может измениться, – пишет NPR. Если хозяин решит скормить Wordsmith массивы более раскованных текстов NPR и слегка подкрутит алгоритм, то «Словесный кузнец» быстро перестроит свою лексику, точнее – расширит границы и принципы ее применения. Это все настраивается.

Кто победил в соревновании? Робот написал быстрее, деловитее. Скот Хорсли, как это ни банально, – медленнее, но человечнее. Аудитория этой заметки – финансисты. Ценна ли для них лирическая вставка про кошельки и блинчики? Покуда читатели еще люди, а не роботы, то, наверное, да, ценна.

В общем, ничья. Хотя две минуты против семи… Для радио, для новостей финансового рынка – это может оказаться критично.

Есенинское состязание жеребенка с паровозом проводилось и в академической среде. В 2012 году Кристер Клирвал (Christer Clerwall), профессор медиа и коммуникаций из университета Карлстад, Швеция, попросил 46 студентов прочитать два спортивных отчета – один написанный роботом, и один – человеком. Человеческая заметка была сокращена до размеров роботической, но и роботическая слегка поправлена редактором: заголовок, лид, первые абзацы – как это обычно делает редактор в СМИ. Студентам было поручено оценить материалы по ряду критериев: объективность, доверие, аккуратность, занудность, интересность, ясность, удовольствие читать, полезность, цельность и т.п.

Результаты показали, что одна заметка выигрывала в одних параметрах, другая – в других. Человеческий текст получил больше баллов по критериям «хорошо написано», «приятно читать». Роботический текст, тоже предсказуемо, получил больше баллов по критериям «объективность», «четкое описание», «аккуратность» и т.п. То есть снова ничья.

Но самое главное, что выявило исследование шведского профессора , – что различия между средним текстом био-журналиста и средним текстом кибер-журналиста незначительны. Это критически важный фактор для оценки будущего и уже настоящего робото-журналистики. Кибер-скептики все время говорят, что робот не может написать лучше человека. Но это неверный подход. «А может, заметке робота не обязательно быть «лучше»? Что если она будет просто достаточно хорошей?» – делится профессор Клирвал своими опасениями с Wired .

Робото-журналистика, третья угроза

Интернет освободил частное авторство. Миллионы людей сами информируют друг друга обо всем на свете. Что самое страшное – бесплатно, но с большим желанием. Да, в интернете полно хлама, но мы потребляем информацию, тщательно подобранную под наши интересы. Контент в сети фильтруется не перед публикацией, а после – в ходе распространения, благодаря вирусному редактору . В результате старые СМИ лишены монополии на формирование повестки. Так что дело не ограничится смертью газет. Интернет угрожает старым СМИ не столько переходом с бумаги на цифру, сколько вовлечением аудитории в авторство.

Другая угроза традиционной журналистике – корпоративные СМИ и прочий контент-маркетинг. Корпорации ведь тоже получили возможность авторства. А значит, им все меньше нужны традиционные СМИ как посредник. Корпорации могут теперь и сами.

И если в среде авторов-любителей контент «улучшается» за счет сотрудничества (вирусный редактор), то корпорации улучшают свою медийность из-за конкуренции за внимание публики. В гонке медийных вооружений они переманивают у СМИ профессионалов, применяют инновации и, что самое главное, переходят от прямой рекламы к социально-значимой тематике. Ведь брендам нужна аудитория: реклама лишь тратит аудиторию, а контент способен ее собирать. И хотя широкой публике эти процессы не очень заметны, но медийность корпораций, развиваясь, наносит традиционным СМИ не меньший ущерб, чем блогосфера.

Однако блогосфера и корпоративная журналистика хотя бы состоят из людей. На несчастную журналистику надвигается третья угроза, бездушная, нечеловеческая. Если блогосфера лишает СМИ подписки, корпорации лишают рекламы, то алгоритмы грозят отнять профессию.

Еще недавно тема робото-журналистики была сильно зарубежной. И в самом деле, тем, кто знаком с бытом российских редакций, довольно трудно представить себе новостные алгоритмы в их обиходе. Но в конце октября «Яндекс» объявил , что создает информагентство, где новости станут писать роботы. Среди редакторов, изможденных борьбой с интернетом и убытками, эта тема вызвала новый приступ смутной тревоги и, конечно, неприятия. «Ну, окей, – говорят те, кто немного знаком с проблемой, – роботы когда-нибудь будут писать спортивные заметки, финансовую аналитику или обзоры погоды. Но на большее они неспособны».

Неверная оценка. Роботы не то что «когда-нибудь будут» писать о погоде, финансах или спорте – они уже вовсю делают это сейчас, причем в умопомрачительных объемах. Соответственно, вопрос в том, будут ли они «способны на большее». Сразу ответ: да.

Заметка о землетрясении и тектонические сдвиги

Это землетрясение вошло в историю журналистики. 17 марта 2014 года в 6.25 утра журналист и программист The Los Angeles Times Кен Швенке (Ken Schwencke) был разбужен подземными толчками. Он подбежал к компьютеру, где в издательской системе его уже ожидала заметка, написанная его алгоритмом Quakebot. Кен пробежал заметку глазами и нажал кнопку «Опубликовать». Так LAT стала первым СМИ , написавшем о землетрясении, – через 3 минуты после толчка. Робот-журналист опередил своих био-коллег.

Поскольку точные сроки названы, называть другие неинтересно, то предреку только, что нас ждет количественная и качественная конкуренция с кибер-коллегами. В количественной конкуренции био-журналисты проигрывают прямо сейчас. В качественной мы уступим в течение 5-7 лет.

Любопытно, что на ранних стадиях перехода журналистики от людей к роботам убийцами профессии станут родные редакторы. Редакции вынуждены производить как можно больше контента, чтобы повысить трафик. Журналисту некогда заняться серьезными темами, он должен гнать материалы на сайт: «motion for motion"s sake» - движение ради движения. Этот эффект теоретик журналистики Дин Старкман (Dean Starkman) назвал hamsterization of journalism – от hamster wheel, беличье колесо. Хамстеризация журналистики в погоне за трафиком сокращает время работы журналиста над материалом ради количества материалов: “do more with less”.

Сто тысяч читателей одной статьи – это качественная журналистика. Но надо ли биться за сто тысяч читателей для одной статьи, если можно поставить сто тысяч статей, каждая из которых принесет десять прочтений? Кого выберет редактор: капризного журналиста с растущей зарплатой и тремя текстами в неделю, или безотказный алгоритм со снижающейся абонплатой и тремя текстами в минуту?

Associated Press покупает услуги Wordsmith вовсе не потому, что «кузнец» пишет лучше человека. А потому, что он пишет больше и быстрее. Так что спор о качестве текста вообще нерелевантен. Роботы захватят редакции благодаря своим экономическим, а не литературным достоинствам.

Роботы-журналисты в России

Что касается прогноза для России, то нужно понять сначала, где мы находимся сейчас. Бототворчество активно развивается в политической сфере и в коммерции, но не в журналистике. Известны любопытные эксперименты Sports.ru – пожалуй, самой инновационной редакции на этом поле. Например, робот ведет там спортивную хронику . Другой робот пишет короткие фразы и подбирает к ним гифки, иногда получается даже смешно .

Примерно треть контента, публикуемого Bloomberg News, создается при помощи технологии автоматизации. Ежеквартально эта система под названием Cyborg помогает выпускать тысячи статей о финансовых отчетах компаний.

Программа обрабатывает отчет в момент его выхода и составляет новость с самыми важными цифрами и фактами. И в отличие от журналистов, которым работа над такими публикациями кажется скучной и однообразной, она не жалуется.

Точный и неустающий Cyborg помогает Bloomberg в гонке с Reuters - главным конкурентом издания в сфере быстрых новостей о бизнесе. Джон Миклетвейт, главный редактор Bloomberg, считает, что финансовые рынки лидируют в сфере использования искусственного интеллекта для выдачи свежей информации.

Роботы-репортеры также довольно хорошо пишут статьи о событиях в сфере низшей лиги бейсбола для Associated Press, о школьном футболе для The Washington Post и землетрясениях для The Los Angeles Times.

На прошлой неделе австралийское отделение The Guardian опубликовало первую статью, написанную в соавторстве с машиной. Речь в ней шла о том, сколько финансов выделило правительство для своих политических партий. А издание Forbes недавно сообщило, что тестирует инструмент под названием Bertie, который умеет создавать черновики и шаблоны статей.

Однако эксперты утверждают, что искусственный интеллект пока что не представляет угрозы для живых журналистов. Скорее, автоматизация позволит людям уделять больше времени более серьезной работе.

«Работа журналиста творческая, она про любопытство, рассказывание историй и желание докопаться до сути, - говорит Лиза Гиббс, директор новостного сотрудничества в A.P. - Вот на что нам бы хотелось, чтобы журналисты тратили свои силы».

A.P. - одно из первых изданий, обратившихся за помощью к технологиям. В 2014 году оно заключило сделку с компанией Automated Insights, разработчиком программы, генерирующей тексты и производящей миллионы сгенерированных историй в год. Associated Press, как и Bloomberg, использовало ее для материалов о финансовых отчетах. После сделки с Automated Insights издание начало выпускать в квартал не 300, а 3700 статей об отчетах.

У The Washington Post есть робот-журналист Heliograf. Он продемонстрировал свою работу во время летних Олимпийских игр в 2016 году и на президентских выборах США в том же году. В прошлом году издание победило в номинации «Лучшее использование ботов » на конкурсе Global Biggies Awards, где отмечаются успехи в применении больших данных и искусственного интеллекта.

Джереми Гилберт, директор стратегических инициатив The Washington Post, утверждает, что издание также использовало ИИ для продвижения статей в определенных регионах (то есть для геотаргетинга).

Разумеется, работа роботов-журналистов не безупречна. Программа может подтянуть данные из финансового отчета без проверки, хотя компании могли составить его таким образом, чтобы приукрасить свои достижения. В Bloomberg стараются улучшить Cyborg так, чтобы программа не допускала таких ошибок.

Хилари Мейсон, генеральный менеджер отдела машинного обучения в компании Cloudera, считает, что искусственный интеллект может помочь в журналистских расследованиях.

«ИИ может обнаруживать аномалии и закономерности во время анализа данных, - сказала она. - А живой журналист способен понять, что они могут означать».

В The Wall Street Journal и Dow Jones технологии помогают выполнять различные задачи - от расшифровки интервью до распознания « ».

Издание The New York Times утверждает, что пока не хочет публиковать генерируемые программами статьи, но заявило, что использует ИИ для персонализации новостных рассылок, модерации комментариев и распознавания изображений для перевода архива своих статей в цифровой вид.

Технологический прогресс уже лишал работы некоторых специалистов из сферы СМИ, например, в свое время исчезли операторы линотипа . Однако репортеры и редакторы пока не опасаются, что программы лишат их работы.

В целом отношение к ИИ в журналистике положительное. Франческо Маркони из The Wall Street Journal сравнил ИИ с появлением телефона. «Он дает больше доступа и возможность быстрее получать информацию, - сказал он. - Это новая сфера, но технологии меняются. Сегодня в центре внимания ИИ, завтра - блокчейн, через 10 лет - что-то другое. Не меняются только стандарты журналистики».

Марк Зионц, руководитель Automated Insights, считает, что машины еще очень нескоро смогут заменить живых репортеров и редакторов. Он признался, что посоветовал своей дочери, которая работает журналистом, познакомиться с этой технологией. «Если вы не учитесь и не адаптируетесь к новым условиям (неважно, в какой сфере вы работаете), то вам будет трудно построить карьеру», - сказал он.

В новостной организации Patch ИИ помогает 110 репортерам и бесчисленным фрилансерам освещать последние события, особенно все, что касается погоды. За прошедшую неделю Patch выпустила 3000 сгенерированных машиной публикаций.

Технологии не только позволят журналистам заниматься более интересным делом, но и облегчат труд редакторов. Как заметил глава Patch Уоррен Сент-Джон, в сгенерированных ИИ статьях не бывает опечаток.

Попытка сделать журналистами роботов давно предпринимается учеными. Имеются также реальные достижения при использовании математических алгоритмов для составления отчетов. Обработке роботом подвергают ситуации на дорогах, прогнозы погоды, сводки и других темы новостей. По сути любые данные можно преобразовывать в связный текст, преподнеся материал для прочтения, публикации.

Данная технология разрабатывается научными компаниями давно. В связи с прогрессом в развитии ведутся дискуссии на тему возможной конкуренции роботов и настоящих журналистов.

Кибер-журналист против био-журналиста

Информатика и сейчас составляет огромную массу того, что входит в понятие журналистики. Процесс достаточно роботизирован при сборе информации, обработке и ее последующей публикации. Но журналист, как человек, более необходим для осуществления диалога с общественностью. Присутствие личности делает журналистику живой и этот аспект не подлежит замене роботом.

При работе с информацией важна точность , особенно когда данные отбираются алгоритмическим методом. Роботы допускают значительно меньше ошибок, чем люди, собирающие данные вручную. Программа тщательно обрабатывает каналы и источники, может сопоставлять данные с историческими сведениями.

Более правильно выделяются основные тенденции, учитывается побочная информация, после чего формируются фразы и предложения. В меньшей степени требуется корректировка. Но если алгоритм был виновником ошибки, человек должен вмешиваться в код или переделывать программу.

Дополнительная этика, требующая вмешательство человека, необходима при создании стиля. Ведь в словарный запас робота возможно включение различных жаргонизмов. Лишь человеческое усмотрение может добавить запрещенные или разрешенные приемы в алгоритм. То же можно сказать об объективности освещения события, регулируемой людьми. Нельзя заставить робота быть более объективным, чем журналист - . Хотя автоматизированную систему можно обучить преподносить тему.

Робот способен генерировать до двух тысяч статей в секунду, что нельзя сравнить с работой человека. Причем одушевленного автора у таких публикаций нет. Различные мнения останавливаются на том, что каждый журналист должен знать, как действуют роботы. А также насколько они соответствуют профессиональной этике, помогая в работе прессы.

Робото-журналистика, третья угроза

Рассматривая возможность полной роботизации журналистики в ближайшие десятилетия, ликвидации профессии журналиста не предвидится. Робот может лишь отвечать на вопросы, а реальный интерес к ситуации питают только живые люди. Интернет лишил журналистов авторства, современный маркетинг вообще не нуждается в помощи СМИ. А теперь надвигается угроза № 3 со стороны автоматизированной прессы.

Современные читатели могут не понять, что некоторые из новостей были составлены роботами. Человек не вмешивается в данный процесс. Так программы могут обработать многие тысячи отчетов о квартальной прибыли. Платформа по формированию видео подготавливает сотни роликов с новостями и загружает их на сайты, телевидение.

Роботы обладают высокой оперативностью, могут проанализировать и подготовить намного больше репортажей, чем журналисты.

Профессионалы несколько нервничают и беспокоятся из-за перспективы потерять работу. Но при публикации тысяч статей, произведенных роботами, не зарегистрировано случаев потери рабочих мест для профессиональных репортеров.

Заметка о землетрясении и тектонических сдвигах

Роботы могут приносить пользу, делая предупреждения о надвигающихся землетрясениях. Хорошо известен случай опубликования роботом статьи о подобном стихийном бедствии в Калифорнии. Спустя 3 минуты после события в газете появилось сообщение с датой, указанием радиуса действия и силы толчка. Заметка была подписана алгоритмом, что было единственным необычным фактом.

За этим стоит некоторый журналист, использовавший свою программу для написания статей. Проснувшись от толчков, он обнаружил, что компьютер уже создал заметку. Ему осталось только нажать кнопку, отправив статью на публикацию. Было доказано: разрабатываемые программы вполне способны анализировать данные о движениях земной коры, передавая их в прессу.

Генеративная журналистика

Современное программное обеспечение может использовать любой человек, скачав его себе на компьютер. Например, производятся игры с роботом - журналистом. Есть платформы, которые снабжают такими программами и системами различные организации. Это автоматические генераторы статей на темы отчетов по прибыли, спорту или для учебных заведений. В Америке технология довольно давно применяется крупными информационными агентствами и поисковиками.

Один из методов автоматизации заключается в создании "путей разветвления". Добавляются предполагаемые текстовые элементы от отдельных слов до целых разделов. Некоторые из них используются в требуемой статье или репортаже, а другие удаляются. Пользователь заносит в программу результаты типа спортивных сводок или финансовых отчетов.

На основе данных образуются ветви, подлежащие дальнейшему построению и развитию в виде словесной конструкции. Подобная структура репортажа является основой для множества статей, каждая из которых будет уникальна в зависимости от введённых данных.

Два аргумента о негодных способностях робота

Есть ли "минусы" в работе роботов при создании новостей? Критика технологии несомненно присутствует. Например, пользователям интернет было предложено проголосовать за статьи от роботов и от журналистов. По результатам человеческая статья оказалась богаче, отличалась большей привлекательностью.

Есть споры о том, что робот не может повторить стиль человека, а также проявить понимание. Дискуссии не лишены оснований, хотя производители роботов утверждают: роботизированная статья может быть стилизована под почерк реального журналиста.

Дорожная карта роботожурналистики

Некоторые предприятия по разработке и производству роботов для журналистики заявляют об ориентировке фирмы на персонализированную информацию. Платформа не стремится создать одну статью, которую будут читать массы. Однако, она может произвести много репортажей, которые касаются каждого и отвечают индивидуальным предпочтениям. Статья будет благодаря вложенным в нее и нужным пользователю данным, которые он ждет и потребляет.

Помимо универсальности одной статьи, есть программы для создания нескольких репортажей. Производители намерены вносить в рассуждения и

Роботы могут быть журналистами, поэтами, но писателями, получающими премии, нет, к такому мир не был готов. Невероятное сделали ученые из Японии

Роботы идут в большую литературу. На литературном конкурсе в Японии второе место занял роман, написанный искусственным интеллектом. Притом, что в состязании участвовали почти 1,5 тысячи авторов, большая часть из которых — живые писатели.
Способны ли роботы заменить человечеству литераторов?

К сожалению, мы не можем процитировать произведение робота, добившегося такого успеха. Это был японский литературный конкурс. Так что нужно сначала перевести на русский. Но перед этим решить, кто это будет делать — робот или человек? Примечательно, что творение искусственного интеллекта добралось лишь до второго места. Как отметило жюри конкурса, роботу немного не хватило искусства, чтобы описать характеры персонажей. И это один из немногих минусов роботов-писателей перед людьми.

Максим Кронгауз филолог «Прогресс за последние десятилетия огромный. Единственное в чем наш последний плюс, если хотите, в том, что мы можем, человечество, точнее наши гении могут продать совершенно необычные тексты. Такие, которые еще не существовали. А роботы и программы соответствующие основываются на уже существующих текстах и существующих шаблонах».

Роботы давно уже обыгрывают людей в шахматы. Недавно искусственный интеллект обыграл человека в китайские шашки — го, игру в которой нельзя все просчитать. Но литература — божество, вдохновенье, слезы и любовь. Тут роботу-писателю пока можно лишь дать алгоритм создания качественного литературного произведения. Но за рамки программы они пока выйти не могут. Впрочем, создатели искусственного властителя дум уверяют, что рано или поздно исправят этот недостаток. Достаточно просто поступает робот-поэт «Яндекса», который рифмует запросы интернет-пользователей и декламирует их:

«Аккорды песни «Че те надо».

Ходить в музеи под дождем.

Россия первый тайм Канада.

Идем в кино, идем, идем.

Кто чемпион, кто проиграл?

Канада — нас. Канада, Карл!»

Если учесть, что лирика — это сплошные вопросы, на которые часто нет ответов, автопоэт «Яндекса» пишет вполне себе стихи. Для сравнения мы через первый попавшийся онлайн-сервис озвучили голосом робота отрывок из случайно выбранного произведения Велимира Хлебникова:

«Гонимый — кем, почем я знаю?

Вопросом: поцелуев в жизни сколько?

Румынкой, дочерью Дуная,

Иль песнью лет про прелесть польки, —

Бегу в леса, ущелья, пропасти

И там живу сквозь птичий гам,

Как снежный сноп, сияют лопасти».

Факт остается фактом: роботы научились писать хорошие литературные произведения. Их книги продаются в магазинах, кто-то покупает и читает. В том же японском конкурсе участвовали почти 1,5 тысячи авторов. Из них было всего 11 роботов, остальные — люди. И все-таки это не значит, что искусственный интеллект скоро заменит людям живых писателей и поэтов. Это скорее означает, что по-настоящему прекрасные литературные произведения — по-прежнему большая редкость. Мир не перевернулся, можно жить дальше.