Сегодня ИИ все увереннее заходит в мир, который казался недосягаемым для машин — в литературу. Но речь не о генерации текстов, а о том, как алгоритмы учатся читать книги, распознавать их структуру, настроение и даже предсказывать их судьбу на полках.

Unsplash

Как ИИ учится читать книги?

Чтобы научить машину читать, ее сначала «сажают» за библиотеку размером с целый континент. Это могут быть сотни тысяч произведений в цифровом формате — от «Войны и мира» до свежих романов с Amazon Kindle. Но ИИ не листает страницы, как мы, он превращает текст в данные и начинает разбирать их на мельчайшие смысловые кирпичики.

Процесс выглядит примерно так:

Разделение текста на элементы Алгоритмы делят книгу на абзацы, предложения и слова, а затем превращают их в числовые векторы — своеобразный «ДНК-код» произведения.

Алгоритмы делят книгу на абзацы, предложения и слова, а затем превращают их в числовые векторы — своеобразный «ДНК-код» произведения. Лексический анализ Система считает частоту слов, ищет устойчивые выражения и определяет, какие слова встречаются вместе чаще всего. Так она выявляет тематические кластеры (например, «звезды», «пустыня», «бесконечность» в научной фантастике).

Система считает частоту слов, ищет устойчивые выражения и определяет, какие слова встречаются вместе чаще всего. Так она выявляет тематические кластеры (например, «звезды», «пустыня», «бесконечность» в научной фантастике). Синтаксическая структура Машина строит грамматические «деревья» для предложений, чтобы понять сложность текста, стиль автора и даже его ритм.

Машина строит грамматические «деревья» для предложений, чтобы понять сложность текста, стиль автора и даже его ритм. Эмоциональная окраска Используя модели анализа тональности, ИИ определяет, какие эмоции преобладают в книге — радость, грусть, тревога, вдохновение.

Используя модели анализа тональности, ИИ определяет, какие эмоции преобладают в книге — радость, грусть, тревога, вдохновение. Сюжетные связи Алгоритмы анализируют, как часто упоминаются персонажи, какие события их связывают и как меняются их отношения на протяжении истории, это позволяет строить карты сюжета.

Алгоритмы анализируют, как часто упоминаются персонажи, какие события их связывают и как меняются их отношения на протяжении истории, это позволяет строить карты сюжета. Сравнение с «эталонными» бестселлерамиКогда ИИ «прочитал» достаточно книг, он начинает сопоставлять новые тексты с успешными, выявляя закономерности — например, что в триллерах успешных авторов поворотный момент обычно наступает между 25–30% книги.

Реальные кейсы: от лаборатории до Netflix

The Bestseller Code

Исследователи Джоди Арчер и Мэттью Джокерс обучили алгоритм на 5000 англоязычных романов, чтобы понять, что отличает бестселлеры от остальных. Результат — модель, предсказывающая коммерческий успех книги с точностью до 80%. Она выявила, например, что темы семьи, любви и личных трансформаций встречаются в топах чаще, чем политические заговоры или абстрактная философия.

Wattpad и «алгоритм писателя»

Платформа Wattpad, где миллионы авторов выкладывают свои истории, использует ИИ для поиска перспективных текстов. Алгоритм анализирует реакцию читателей — где они делают паузы, какие отрывки пересылают друзьям, сколько времени проводят на каждой главе — и по этим данным прогнозирует, кто может стать следующим популярным автором. Некоторые найденные таким образом романы уже стали фильмами на Netflix.

Может ли ИИ убить интригу?

Главная угроза, о которой говорят критики, — это «унификация» литературы, если алгоритмы будут подсказывать издателям, что лучше продается, и те будут опираться на эти данные, то мир рискует получить море однотипных книг с одинаковыми сюжетными кривыми.

С другой стороны, ИИ может стать отличным помощником для поиска жемчужин среди дебютов, которые иначе так и остались бы в столе. И, возможно, алгоритмы просто помогут авторам лучше понимать, что именно зацепит их аудиторию.

Что будет дальше

1. Тестирование книг до печатиАлгоритмы будут моделировать реакцию читателей на рукопись еще до выхода книги. Можно будет понять, где темп проседает, а где сюжет «крючком» цепляет внимание.

2. Персонализированные книгиЛюбите атмосферу Агаты Кристи, но хотите динамику Ли Чайлда? ИИ сможет адаптировать сюжет, стиль и даже жанровую подачу под ваш вкус — буквально создать «ваш личный роман».

3. Алгоритмические редакторыИИ станет полноценным редактором-помощником: выявит слабые диалоги, посоветует добавить эмоций, ускорить или замедлить ритм.

4. Нишевые бестселлерыМашина сможет находить крошечные, но страстные аудитории — и помогать авторам писать под их интересы.

5. Прогнозируемые экранизацииЕще на стадии рукописи ИИ будет оценивать потенциал книги для экрана и предлагать её Netflix, Amazon или отечественным стримингам.

6. «Умные» книжные клубыНовые платформы будут подбирать книги на основе вашей реакции на текст, а не просто покупок других людей. Это рекомендации, которые действительно попадают в цель.

ИИ не заменит писателя, но может стать его лучшим союзником — тем, кто умеет видеть паттерны в миллионах историй и подсказывать, как сделать книгу именно той, которую невозможно отложить.