MIT научили ИИ писать рождественские истории. Но они получились очень странными

26.12.18
0
12651
фон:

В мире существует уже немало алгоритмов, которые на основе нейронных сетей могут генерировать самые разные произведения. Они пока все еще мало применимы на практике, а некоторые и вовсе используются для веселья. В прошлом году Джанель Шейн совместно с New York Times использовала ИИ для генерации названий костюмов на Хэллоуин. А недавно Уилл Найт из MIT решил повторить эксперимент, только в этом случае тот же ИИ использовался для того, чтобы создать сюжеты рождественских историй. Получилось весьма неоднозначно.

Для работы было решено выбрать 360 рождественских фильмов, описания сюжетов которых были взяты на Википедии. Алгоритм, использованный в работе, был тот, же, что и при генерации названий хэллоуинских костюмов — textgenrnn.

«Textgenrnn имеет два режима: вы можете использовать буквы для генерации слов в стиле других слов, или же использовать слова для генерации предложений в стиле других предложений.» — объяснил принцип работы ИИ Уилл Найт

Нейросеть имеет массу настроек, но исследователь сконцентрировался на трех из них — «количество слоев», «количество эпох» и «температура». Это условные названия и они отражают совсем не то, что вы думаете глядя на них.

«Слои относятся к сложности нейронной сети: чем больше слоев она имеет, тем сложнее данные, которые она может обрабатывать. Количество эпох — это количество раз, которое есть у неросети для просмотра исходны данных для обучения, после чего она может выдавать результаты. Ну и температура: чем она ниже, тем больше сеть будет выбирать общие слова в наборе данных по сравнению с теми, которые используются реже.»

В итоге все результаты выглядели крайне странно. Вот один из синопсисов. Перевод очень приблизительный, ведь нейросеть написала порой несогласованные друг с другом слова и не соблюдала орфографию и пунктуацию.

«Мэри должна найти друзей из магии и остановить Нэйтана от начала Рождества. Серьезные курортные эльфы позаботились о том, чтобы с теннисным рождественским открытием получить умершую Калифорнию, где сурок ждет того, как мудрый дворник травмировал Рождество. Героям нужно выжить в этом шоу не смотря ни на что.»

Звучит как бред и даже совсем не весело, в отличие от прошлогоднего эксперимента, когда ИИ предлагал весьма забавные названия костюмов на Хэллоуин вроде «сексуального человека из Minecraft». Так подумал и исследователь, начав разбираться, в чем же проблема.

«Одной из проблем было то, что нейросети дали слишком мало данных для обучения. Всего 360 произведений. Обычно для обучения нейросети нужно в несколько раз больше информации. Другой проблемой было то, что textgenrnn оказался не так хорош в построении предложений по сравнению с альтернативами. Но главная причина заключается в ограничениях генерации предложений. Даже если бы я использовал больше данных и они были бы лучшего качества, задача достигнуть согласованности описания практически невыполнима.»

Хотя каких-то вменяемых и даже смешных результатов добиться все-таки удалось. Некоторые синопсисы получились вполне забавными.

Синопсисы

Семья рождественского террориста переезжает в новый город и планирует справить Рождество.
Принцесса-огр хочет отменить Рождество
Ангел Санта Клауса работает на заводе

Некоторые названия несуществующих фильмов получились довольно хороши и к ним даже нарисовали постеры.

«Бойцовское Рождество»

«Рождественская Миля»

«Оно Санта»

Источник