Электронная библиотека
Форум - Здоровый образ жизни
Акупунктура, Аюрведа Ароматерапия и эфирные масла,
Консультации специалистов:
Рэйки; Гомеопатия; Народная медицина; Йога; Лекарственные травы; Нетрадиционная медицина; Дыхательные практики; Гороскоп; Правильное питание Эзотерика


1. Бестселлерометр, или Почему анализ текста приводит к революции в книгоиздании

Одним прекрасным утром 2010 года литературный агент Стига Ларссона сидел и радовался жизни. 13 июня «Девушка, которая взрывала воздушные замки»[1] – третья книга в серии ранее неизвестного автора – дебютировала первой в списке бестселлеров в твердом переплете, составленном газетой New York Times. Спору нет, приятно увидеть такое за утренним кофе. «Воздушные замки» на первом месте, «Девушка с татуировкой дракона»[2] лидирует сразу в двух форматах среди книг в мягком переплете, и, в качестве приятного дополнения, «Девушка, которая играла с огнем»[3] – на втором месте. И так – уже 49 недель в США и три года подряд в Европе. Есть чему радоваться.

Через месяц Amazon объявит, что Ларссон – первый в истории писатель, чьи творения разошлись в количестве миллиона экземпляров в формате для Kindle. За следующие два года совокупный тираж всех изданий Ларссона превысит 75 миллионов. Неплохо для никому не известного политического активиста из крохотной скандинавской страны, вдруг заделавшегося писателем. Особенно если учесть, что шведское издание вышло под довольно непривлекательным заглавием и что в книге содержатся откровенные описания насилия и пыток. «Мужчины, которые ненавидят женщин» – или «Девушка с татуировкой дракона», как назвали английский перевод, – стала сенсацией года в тридцати с лишним странах.

Журналисты не могли объяснить этот успех. Крупные газеты заказывали специалистам большие статьи, желая понять, что, черт побери, происходит в книжном мире. Почему именно эта книга? Откуда такой ажиотаж? В чем секрет? Кто мог бы предсказать этот поворот событий?

Ответы не впечатляли. Литературные критики чесали в затылке. Они указывали на недостатки структуры, стиля, сюжета и характеров героев. Они ужасались качеству переводов. Они жаловались на глупость читающей публики. Но читатели продолжали расхватывать книги практически с печатного станка – в Великобритании, США, Японии, Германии; мужчины, женщины, старые, молодые, черные, белые, любой ориентации. Почти в любой точке земного шара у любого нашлись бы знакомые, прямо сейчас читающие трилогию о девушке с татуировкой дракона.

В книжном мире такое бывает не слишком часто. Феномен вроде Ларссона появляется раз в год, а может, и того реже. После Ларссона подобный оглушительный успех снискала Э. Л. Джеймс с книгой «Пятьдесят оттенков серого»[4] – причем, в отличие от Ларссона, она была жива и могла принять участие в рекламном турне. Ларссон же умер, не дождавшись публикации. Его трилогия достигла такого огромного объема продаж вообще без участия автора. Непостижимо. Непредсказуемо. Просто аномалия какая-то.

Давайте посмотрим на цифры. В американском штате Делавэр есть компания Bowker – глобальный поставщик библиографической информации и единственный источник идентификационных номеров (ISBN) для книг, издающихся в США. По данным Bowker, каждый год в США выходит приблизительно 50–55 тысяч новых наименований художественной литературы. Учитывая, что все больше произведений публикуют сами авторы в электронном виде без получения ISBN, это число занижено. За год в список бестселлеров газеты New York Times попадает примерно 200–220 книг. Даже если использовать заниженную общую цифру, это меньше чем 0,5 % от всех опубликованных. Из этой половины процента лишь немногие задерживаются в списке на несколько недель («двузначные», как называют их профессионалы книжного дела). И только малая доля авторов умудряется продержаться в списке десять недель или больше, а из их числа, вероятно, лишь у трех или четырех одна книга достигает миллионных тиражей в США в течение года. Но почему именно эта, а не другая?

Считается, что беллетристу, желающему завоевать читательскую аудиторию, нужно владеть определенными навыками: он должен правильно построить сюжет, убедительно обрисовать характеры и при этом грамотно писать. Очень успешные авторы пошли дальше: они зорко подмечают все состояния человеческого духа, умеют лихо закрутить сюжет не в ущерб правдоподобию и, наконец, редко, но метко пользуются точкой с запятой. Все это – признаки хорошего писателя, а хороший писатель, если он готов приложить достаточно усилий, в конце концов найдет своего читателя. Но мы говорим о всеобъемлющем успехе, когда сотни тысяч разом читают одно и то же – этот триллер, а не тот, этого кандидата на Пулитцеровскую премию, а не какого-либо другого. Если оставить в стороне вмешательство Опры Уинфри, это значит, что есть какой-то неучтенный фактор – будто на нашего автора просыпалась с неба щепотка звездной пыли, такой тонкой, что ее не распознать никакими приборами. Внезапный и необъяснимый успех таких книг, как трилогия о девушке с татуировкой дракона, «Пятьдесят оттенков серого», «Прислуга»[5], «Исчезнувшая»[6], «Код да Винчи»[7], считается большой удачей автора, но при этом случайной, как выигрыш в лотерею.

Кстати сказать, слово «бестселлер» изначально было жаргонным словечком издательской отрасли. Оно относительно новое – впервые вошло в словари английского языка в конце XIX века, примерно тогда же, когда появились первые списки книг, лидирующих по количеству проданных экземпляров. Это слово по идее должно быть нейтральным, но за свою жизнь оно обросло определенными коннотациями, отчасти вводящими в заблуждение. Литературный журнал Bookman начал публиковать ежемесячные отчеты по продажам книг в 1891 году в Лондоне и в 1895-м – в Нью-Йорке, после появления Закона о международном авторском праве (1891), осложнившего распространение дешевых пиратских копий британских романов в США. До этого вести статистику по продажам было невозможно. Списки выходили во всех крупных городах и обычно включали в себя шесть книг, которые лучше всего продавались за истекший месяц. С самого начала эти списки выполняли две функции, невиданные ранее в книжном мире: во-первых, они составлялись исключительно на основе количества проданных экземпляров, а во-вторых, служили рекомендацией упомянутых книг для читателей. Эти рекомендации были основаны не на мнениях горстки критиков или рекламе издателей, а на выборе точно таких же читателей, обычных людей. Покупка книги была и остается единственным способом за нее проголосовать. Таким образом, термин «бестселлер» не несет никакой информации о качестве и тематике книги и не является синонимом выражений «жанровая проза» или «популярное чтиво». Некоторые деятели литературного истеблишмента действительно употребляют это слово как оскорбление: они считают, что коллективный вкус читательской аудитории равняется только на плохую литературу, но объективные данные свидетельствуют об обратном. В числе бестселлеров были как книги, удостоенные Пулитцеровской премии, и великие американские романы, так и произведения, рассчитанные на массового читателя. Среди авторов можно найти не только Майкла Коннелли с Дебби Макомбер, но и Тони Моррисон с Маргарет Этвуд. Именно поэтому список бестселлеров – достойное внимания, интересное и динамичное культурное явление.

Ясно, что, написав такую книгу, автор внакладе не останется. Не останутся без прибыли и агенты, обнаружившие ее, и редакторы. И книготорговцы тоже – ведь они держатся на плаву и не уходят из бизнеса лишь благодаря немногим хорошо продающимся произведениям.

Конечно, мы сейчас говорим о материальной выгоде. Допустим, вы давно рассказывали друзьям, что у вас внутри сидит роман и просится наружу, – и вот вы в самом деле выплеснули его на бумагу и получили за это семи- или даже восьмизначный аванс. Такое бывает – с немногими авторами, но все же бывает. Можно окружать богемным флером фигуру бедного писателя, скрипящего карандашиком в блокнотике, но куда приятней думать о том, как твоя книга появится в каждой квартире – на полке или на тумбочке у кровати – и на iPad или Kindle у каждого пассажира в каждом вагоне метро! И все это – на многих языках, по всему миру!

Такой блеск, такое драматическое восхождение к славе характерны для немногих «книг года». В книжном мире они играют роль дорогих особняков, шикарных машин и бриллиантовых диадем. Если автор попал в список и умудрился там зацепиться, его ждут почет, уважение, зависть и злые слова. Автора могут пригласить в жюри литературного конкурса или давать ему на рецензию другие книги. Возможно, у него купят права на экранизацию. О нем будут говорить.

Правда, было бы здорово, если бы такой успех можно было предсказать?

Белые лебеди

Смелая гипотеза авторов сего труда состоит в том, что романы попадают в списки бестселлеров New York Times отнюдь не случайным образом и что пути книжного рынка вовсе не так неисповедимы, как принято считать. Бестселлеры, независимо от жанра, похожи друг на друга по большому количеству параметров (впрочем, не бросающихся в глаза), и, изучая эти параметры, можно лучше понять, что мы читаем и почему. Более того, можно разработать алгоритмы для выявления носителей «ДНК бестселлера» среди новых, еще не опубликованных книг.

У профессионалов книжной отрасли бытует мнение, что успех полностью определяется громким именем, затратами на рекламу или широкомасштабными мероприятиями по продвижению книги. Конечно, все это имеет значение, но наши результаты доказывают: далеко не все определяется шумихой, поднятой вокруг книги. Этот вывод должен обрадовать писателей, которые трудятся, оттачивая свое мастерство. Результаты нашей пятилетней работы дают основания предположить, что бестселлером книгу делают правильные слова, расположенные в правильном порядке. Это значит, что даже в самой интересной истории, связанной со списком бестселлеров New York Times, речь идет исключительно об авторской рукописи как таковой – только о черных чернилах на белой бумаге, и больше ни о чем.

Используя компьютерную систему, которая читает книги, распознает в них определенные характеристики и просеивает тысячи таких характеристик в тысячах текстов, мы открыли, что существуют удивительные сочетания параметров, свойственные книгам, которые с наибольшей вероятностью будут пользоваться успехом на рынке. Эти параметры могут многое поведать о нас, читателях, и о том, как мы читаем. На этих страницах мы расскажем, как и зачем мы построили такую модель и как она обнаружила, что в 80–90 % случаев очень легко различить бестселлер среди других книг в использованном нами корпусе текстов. Наши компьютеры выявили 80 % книг, побывавших в списке New York Times за последние 30 лет, и назвали их вероятными кандидатами в бестселлеры. Более того, наша система обрабатывала каждую книгу так, словно это новая, никому не известная рукопись, а затем не просто выносила один из двух вердиктов – «вероятно, бестселлер» или «скорее всего, нет», – но и вычисляла индекс, указывающий, каковы шансы книги обрести популярность. Эти индексы сами по себе чрезвычайно интересны, и мы не только расскажем, как они устроены, но и объясним, что держит читателя как магнитом, заставляя переворачивать страницы одну за другой.

Рассмотрим индексы, вычисленные нашей системой. Она предсказала, что «Инферно»[8] Дэна Брауна окажется бестселлером с вероятностью 95,7 %. «“Линкольн” для адвоката»[9] Майкла Коннелли – с вероятностью 99,2 %. Обе побывали на первом месте в списке New York Times – то есть, пожалуй, на самой престижной позиции, какую может завоевать книга. Конечно, Браун и Коннелли – известнейшие авторы с прочным положением на литературном Олимпе. Но наша система не знает имен авторов и с той же уверенностью раздает оценки трудам неизвестных писателей. Например, «Вязание по пятницам»[10], дебютный роман Кейт Джейкобс, получил оценку 98,9 %. «Счастливые девочки не умирают»[11], совсем другой по характеру дебютный роман Джессики Нолл[12], получил индекс успеха 99,9 % – исключительно на основе текста. Книги Джейкобс и Нолл попали в список бестселлеров и задержались там на много недель. «Марсианин»[13] (еще до того, как Мэтт Деймон пообещал сыграть главную роль в экранизации) получил 93,4 %. Можно привести примеры из самых разных жанров: «Телефонный звонок с небес»[14] (произведение из разряда «литература о духовности») Митча Элбома – 99,2 %; «Искусство поля»[15], литературный дебют Чеда Харбаха, – 93,3 %; «Обнаженная для тебя»[16], эротический любовный роман Сильвии Дэй, – 91,2 %.

Эти индексы, измеряющие «бестселлерный потенциал» книги, приводят в восторг одних людей, возмущают других и у многих вызывают подозрение. Последних можно понять: эти индексы не укладываются в голове, они как будто ниспровергают существующий порядок вещей. Некоторым ветеранам книжной индустрии они кажутся абсурдными. Но они могут совершить переворот в книгоиздании, и уж точно благодаря им вы будете совсем по-другому воспринимать следующий бестселлер, который попадет вам в руки.

Здесь мы должны прояснить важный момент. Ни одна из книг, упоминающихся в данной работе, никогда никем не приобреталась на основе индексов, вычисленных нашей системой. Кроме того, за исключением данной публикации, мы никогда не доводили эти индексы до сведения какого-либо книжного агента или издательства. Следует также оговорить, что все полученные нами численные показатели специфичны для конкретного корпуса текстов, на котором проводилось исследование, – при составлении этого корпуса мы добивались максимального сходства с ассортиментом, который вы увидите, зайдя в любой крупный книжный магазин. Книжные агенты и издатели знают свое дело – они трудятся, наполняя полки магазинов книгами, и нам всегда есть что почитать. Иные деятели издательской нивы обладают чем-то вроде дара царя Мидаса – обращать своим прикосновением рукописи в золото. Но не забывайте, что средняя доля бестселлеров среди опубликованных книг – меньше половины процента. Иными словами, чтобы наконец выиграть, приходится долго рисковать. Заметьте также, что год за годом в списках фигурируют одни и те же чрезвычайно успешные авторы, десятилетиями возглавляющие рейтинги. Стивену Кингу шестьдесят восемь лет. Джеймсу Паттерсону шестьдесят восемь лет. Даниэле Стил шестьдесят восемь лет. Конечно, поклонники рады каждой новой книге любимого автора, но это значит, что книжный мир еще не открыл следующее поколение писателей, которые так же стабильно будут поставлять бестселлеры на рынок следующие тридцать или сорок лет. Кроме того, хотя ежегодно тысячи рукописей отвергаются и тысячи публикуются, в 2014 году издателям так и не удалось найти бешено успешный бестселлер («Татуировка дракона», «Оттенки серого» и «Исчезнувшая» были хитами предшествующих годов). В 2012 году ни одно из опубликованных литературных произведений не впечатлило комитет по присуждению Пулитцеровской премии. Почему?

Если верить расхожему мнению, любой бестселлер – аномалия. Удачная флуктуация на рынке. Интересный мутант. Черный лебедь. Но если это правда, то, единожды найдя писателя, способного выдавать бестселлеры, надо вкладывать все деньги в него? Зачем рисковать миллионами, ставя их на никому не известного двадцатилетнего юношу вместо Стивена Кинга? Ведь нет способа узнать, стоит ли новый автор всех тех денег, которые вы собираетесь в него вложить, и поможет ли он вам сорвать куш.

У жаргона книгоиздательской индустрии очень много общего с жаргоном игорного бизнеса, и это не случайно. На совещаниях по вопросам покупки рукописей часто употребляется выражение «поставить на» такого-то автора. Если два издательства наперебой торгуются за одну и ту же книгу, одно из них может «пойти ва-банк» и потратить на нее весь свой сезонный бюджет. Это чрезвычайно интересное занятие, и риск, на который идут издательства, безусловно, обоснован, но все же это – азартная игра, практически как в казино. Прежде чем рукопись «Гарри Поттера»[17] приняли в издательстве Bloomsbury, Дж. К. Роулинг получила 12 отказов в других местах и совет «не бросать основную работу». Сегодня стоимость бренда «Гарри Поттер» оценивается в сумму около 15 миллиардов долларов. Джону Гришэму отказали не менее 16 разных издательств; с тех пор Гришэм создал более двенадцати бестселлеров года, опередивших по уровню продаж все остальные книги[18]. Джеймс Паттерсон несколько раз пытался опубликовать свои рукописи и всюду встречал отказы; в 2010 году три его книги разошлись общим тиражом 3,5 миллиона. Кэтрин Стокетт получила отказы от шестидесяти агентов, прежде чем нашла одного, который согласился представлять ее «Прислугу»; впоследствии этот роман пробыл в списке бестселлеров New York Times на протяжении ста недель. Без сомнения, множество подобных книг сейчас пылится в отвалах так называемого «самотёка» в конторах издателей, которыми усеяны Нью-Йорк и Лондон.

Если вы имеете хотя бы косвенное отношение к книжному миру, наверняка у вас есть знакомый или знакомый знакомого, который годами вставал в четыре часа утра, чтобы успеть написать хоть немножко до работы. У него был абсолютно беспроигрышный сюжет, он чувствовал, что музы невидимо реют над его головой… А потом он разослал рукопись во все издательства на Манхэттене и не получил в ответ ничего, кроме стандартных отписок-отказов.

Эти знакомые знакомых вовсе не одиноки. Один издатель, прочитав рукопись «Шпиона, пришедшего с холода»[19], заявил Джону ле Карре, что как писатель он безнадежен. «Повелитель мух»[20] Уильяма Голдинга получил 21 отказ. Ознакомившись с рукописью Джека Керуака «В дороге»[21], ныне культовой книгой поколения, издатель заявил: «Я вообще не понял, о чем это». Урсуле ле Гуин сказали, что ее «невозможно читать». Впоследствии «совершенно нечитабельная» книга ле Гуин получила две крупные литературные награды. Даже «Скотный двор»[22] Оруэлла сочли негодным к публикации – причем не кто иной, как Т. С. Элиот. Великий поэт решил, что эта выдающаяся политическая аллегория, актуальная для всех времен и народов, «недостаточно убедительна».

Публиковать или не публиковать? Вот в чем вопрос. Чтобы предсказать книге большой успех, нужно проанализировать душевные движения и чувствительные места сотен тысяч человек. Это непростая задача, и часто отказы выглядят вполне обоснованными. Например, мы опросили американских издателей, отвергнувших «Девушку с татуировкой дракона», и они сказали, что, по их мнению, американской публике неинтересны все эти детали шведской политики. Лисбет Саландер, на их взгляд, слишком агрессивна и непредсказуема для центрального женского персонажа. Они сочли, что широкие массы читателей отпугнет чудовищная сцена анального изнасилования и Лисбет-мстительница, вооруженная татуировочными иглами. Все эти соображения кажутся весьма разумными.

Поэтому неудивительно, что издатели в минуту откровенности заявляют: пророчить книге успех – все равно что определять направление ветра, послюнявив палец, или смотреть в хрустальный шар, который, похоже, спрятан под столом у самых удачливых агентов и издателей. За исключением случаев, когда автор уже популярен – например Нора Робертс или Джеймс Паттерсон, – делать такие прогнозы – все равно что стрелять в цель с завязанными глазами. Иногда помогают обстоятельства: например, если автор – голливудская звезда, а книга посвящена ее сексуальным похождениям. Но бывало и так, что дело казалось верным, за большим авансом следовали огромные тиражи – и их приходилось пускать под нож. Вкусы публики переменчивы.

Конечно, все агенты и издатели стараются понять, что движет коммерческим книжным рынком – в области чтения для масс, на которую ориентирована, к примеру, писательница Патрисия Корнуэлл, ветеран франшизы в литературе, или в более скромном, но все же удовлетворительном масштабе тиражей, характерных для успешных современных литераторов. Известен анекдот о том, как (ныне бывшего) генерального директора одного из крупнейших нью-йоркских издательств попросили предсказать заглавие книги, которая точно станет бестселлером. «Собака врача президента Линкольна», – ответил он. И впрямь, имя всеми уважаемого президента в сочетании со словами «врач» (наша одержимость собственным здоровьем) и «собака» (любимое домашнее животное американцев) – верный рецепт успеха.

Это, конечно, шутка, но, оказывается, под таким названием вышла даже не одна, а две книги! И обе провалились. Преподаватель литературы и писатель Джон Сазерленд, выпустивший два исследования на тему бестселлеров, завершил одно из них словами: «В конечном счете бестселлер отличается от всех остальных книг тем, что он лучше продается. И больше ничем». Далее он добавляет, что «искать какие-то значимые закономерности, тенденции, сходство [между книгами, завоевавшими популярность] бессмысленно, а результаты этого поиска повергают в недоумение». Вердикт Сазерленда кажется обоснованным, справедливым и окончательным. Точнее, казался таковым до появления компьютеров, которые научились читать тексты и вычислять секретный рецепт, позволяющий попасть в список бестселлеров New York Times.

Из любви к книгам

Вернемся к писателям, которые получили множество отказов, но в конце концов прославились. Наша система предсказала Дж. К. Роулинг успех с вероятностью 95 %. Джону Гришэму – с вероятностью 94 %. Паттерсону – 99,9 %. История позволила нам убедиться в точности этих предсказаний. А вот с книгой Кэтрин Стокетт «Прислуга» наша система ошиблась. «Прислуга» оказалась в числе примерно 15 % книг, которые повергли компьютер в недоумение. Он дал ей лишь 50 % вероятности стать бестселлером. В следующих главах мы расскажем о сложностях, с которыми столкнулись, моделируя работу редактора с помощью компьютера. Пока достаточно будет сказать, что система проводит чрезвычайно глубокий анализ; прочитав книгу Стокетт, она заключила, что стиль в целом хорош и понравится американским читателям, что тематика тоже в целом хороша, но использование эмоционально нагруженного языка и в особенности глаголов отличает «Прислугу» от книг, с большой вероятностью попадающих в список бестселлеров. Речь идет о книге, которая привлекла внимание рецензентов тем, что белая писательница активно использовала имитацию диалекта чернокожих персонажей. Мнения рецензентов о правомочности такого авторского решения разделились; и оказалось, что наша система в точности предсказала это разделение во всех источниках, от New York Times до сайта goodreads.com.

Вероятно, вы спросите: зачем пытаться с помощью компьютера смоделировать работу, которую и так выполняют хорошие редакторы? Возможно, будь наша система уже внедрена, творения Дж. К. Роулинг опубликовали бы раньше. Возможно, Джон Гришэм получил бы аванс побольше за свою первую книгу «Пора убивать»[23]. Но в конце концов эти писатели добились славы. Редакторы были не уверены в успехе «Прислуги». Наша система – тоже. Какая тогда от нее польза?

Дело в том, что мы ищем компоненты успеха не только для того, чтобы получить от этого материальную выгоду. Конечно, очень интересно, что наша система выделила из общей массы Дж. К. Роулинг, Лиану Мориарти (вероятность успеха 99,6 %) или Джонатана Франзена (98,5 %). Мы считаем, что публичное обсуждение сотрудничества человека и компьютера важно, особенно в том, что касается творческой деятельности. Но поиски новых подающих надежды рукописей в пошатнувшейся книгоиздательской отрасли проводятся с целью не только удержать эту отрасль на плаву, но и поддержать ее разнообразие. Безусловно, нами движет желание выявить и объяснить скрытые закономерности человеческой культуры. Но, если подходить к делу более практично, мы хотим помочь издательствам в поиске новых авторов, чтобы направить часть бюджета, отведенную Кингу, Паттерсону или Стил, на молодых писателей, которые придут им на смену. Мы хотим, чтобы писатели – как опытные, так и молодые – узнали больше о своем ремесле и получили информационную поддержку. Мы хотим, чтобы книги людей, не имеющих нужных контактов в Нью-Йорке, нашли своего читателя. Нашей системе все равно, публиковался ли этот автор раньше, есть ли у него диплом бакалавра искусств, мужчина это или женщина, латиноамериканского или китайского происхождения, красив автор или некрасив и сколько ему лет – двадцать пять или семьдесят. Поэтому наша работа еще и уравнивает шансы на успех. Может быть, в один прекрасный день знакомый вашего знакомого отправит рукопись в издательство, получит индекс 80 % и ему выдадут хороший аванс, так что он сможет наконец уволиться с работы, и ему больше не нужно будет вскакивать в четыре часа утра, чтобы выкроить время для писательских занятий.

Когда мы пишем о романах, фигурирующих в самом знаменитом и уважаемом списке – еженедельном списке бестселлеров New York Times, – мы тем самым кричим во все горло, призывая неравнодушных читателей – как профессионалов книжного мира, так и любителей – поговорить о книгах для масс[24]. Над бестселлерами чаще потешаются, чем рассматривают как серьезные литературные произведения или хотя бы плоды писательского мастерства. Однако, игнорируя их, мы упускаем большую часть современной культуры и истории чтения. Помимо того что авторы бестселлеров приносят в экономику миллионы долларов, их заслуга – в том, что они заставляют нас читать. Они заставляют нас воображать, обсуждать, думать, чувствовать, сопереживать другим. Они помогают фантазировать, подглядывать за чужой жизнью, бежать от действительности. Романисты из списка New York Times дают пищу для разговоров и споров о литературе по всей стране – в барах, в поездах, дома за ужином. Именно на этих писателей смотрят, желая узнать, куда движется наша литература. Именно к ним обращаются, чтобы лучше понять жизнь. К ним прибегают, чтобы развить вкус, выработать мнения и научиться их выражать. Мы будем только рады, если сможем рассказать читателям что-то новое об их любимых писателях.

Вероятно, вы уже поняли: авторы, то есть мы, до того страстно преданы книгам и чтению, что отдали в общей сложности пятьдесят лет изучению и преподаванию нарратива и еще несколько – закупкам и продажам книг для крупнейших издателей страны. Мы выступали в роли наставников при написании романов и отстаивали свое право любить и ненавидеть разные (а иногда – одни и те же) произведения. Мы расхваливали издателям книги самых разных жанров, стараясь добиться их публикации. Мы (иногда втайне) помогали своим лучшим студентам и своим друзьям, мечтающим о карьере литератора, писать письма их родителям, супругам и будущим издателям, объясняя, почему автор письма просто обязан был бросить устроенную жизнь, учебу на врача – и отправиться на поиски колдовского зелья, сулящего то экстаз, то депрессию, – на поиски жизни в словах и историях. Не будет преувеличением сказать, что мы «купились» на ту свободу, то высшее (высочайшее) образование, которое получаешь, читая и создавая книги. Мы в первую очередь читатели, а потом уже писатели. Учитывая наше преклонение перед книгами, нет ничего удивительного в том, что мы обратились за помощью к компьютеру.

Откуда мы взялись

Вероятно, больше всего открытию «бестселлерометра» (прозвище нашей системы) удивились мы сами. Честно говоря, наши исследования начались лишь потому, что нас «нутром» потянуло в эту сторону. Четыре года ежедневного совместного труда принесли результаты, каких ни один из нас не ожидал, несмотря на наш разнообразный опыт: у Джоди – в книгоиздании и современной литературе, а у Мэтта – в литературе и модной нынче дисциплине, именуемой «цифровые гуманитарные науки».

Все началось с того, что Джоди ушла с должности редактора-рецензента в издательстве Penguin Books, чтобы пойти в аспирантуру по английскому языку в Стэнфордском университете. От работы в книжной индустрии у Джоди остался жгучий вопрос, на который она так и не получила ответа: отчего романы становятся бестселлерами? А также связанные с этим скрытые, еще более интересные вопросы: почему читатели читают? Какую роль выполняет чтение в современной культуре?

Когда Джоди только пришла работать в Penguin, ее определили в отдел продаж. Иногда в обеденный перерыв она заглядывала в ближайший книжный магазин, чтобы проверить, выполняет ли он свои обязательства по продвижению книг – действительно ли те размещены на бойких местах в соответствии с суммами, потраченными на маркетинг. Очень часто, и это отнюдь не секрет, издатели платят за то, чтобы их «хиты» выставлялись на виду. Руководство магазина берет деньги и обязуется расположить книгу, например, в первом ряду на первом столе или на полке так, чтобы обложка была полностью видна и смотрела прямо на покупателя. Считается, что такое стратегическое размещение способствует продажам. В то время по спискам бестселлеров шествовал победным маршем «Код да Винчи». Неделю за неделей Джоди видела большую синюю цифру «1» и убеждалась в том, что роман Дэна Брауна продолжает покорять мир.

Через несколько месяцев стало очевидно: сколько бы издатели ни платили за размещение клонов Дэна Брауна на видных местах, им не светило попасть в одну лигу с «Кодом да Винчи». Его феноменальный успех объяснялся не суммами, затраченными на рекламу и маркетинг, а чем-то другим. Никакие расходы не гарантируют столь длительного воздействия на умы читателей всего мира и тем более не обеспечат тиража 80 миллионов. Такой успех не может объясняться только рекламной шумихой. Значит, есть что-то кроме маркетинга, связанное именно с этими словами на этих страницах.

Конечно, глупо было бы утверждать, что маркетинг и реклама совсем не влияют на продажи. Разумеется, влияют. Должна быть некая корреляция, объясняющая тот факт, что 80 % бестселлеров принадлежат пяти крупнейшим издательствам, обладающим значительными средствами на рекламу и маркетинг. Но было бы так же глупо утверждать, что любой доллар, затраченный на маркетинг, всегда дает одинаковую отдачу: слишком много мы видели и огромных сумм, потраченных безрезультатно, и публикаций силами автора, имевших бешеный успех. «Пятьдесят оттенков серого» сначала появилась в электронном виде, а также распространялась по модели «печать по требованию» в мягкой обложке – издательством, у которого вообще не было ни гроша на рекламу. Чтобы напечатать свою книгу «Хижина»[25], Уильям Пол Янг воспользовался кредитными карточками, а на маркетинг потратил всего 300 долларов – во столько обошлась ему разработка веб-сайта. На сегодня эта книга разошлась десятимиллионным тиражом. Вот примеры других бестселлеров, непохожих на «Хижину», но также пришедших к успеху и похвале критиков через нетрадиционные каналы распространения: экспериментальный онлайн-роман Марка Данилевского «Дом листьев»[26] и книга Криса Уэра «Джимми Корриган, самый умный ребенок на Земле»[27], первоначально опубликованная на средства автора, а ныне один из самых популярных «графических романов» новой волны. Примеров таких можно набрать много – достаточно, чтобы понять: на вопрос «почему одни книги читают миллионы, а другие в лучшем случае десятки людей?» ответить «маркетинг» – значит в лучшем случае ответить наугад.

Джоди пришла со своим исследовательским вопросом к Мэтту, который в то время был лектором в Стэнфордском университете и сооснователем Стэнфордской литературной мастерской. Объединив усилия, Джоди и Мэтт поняли, что существует другой ответ, не просто «маркетинг». В 2008 году Мэтт как раз закончил свою часть работы над исследованием авторского стиля священного текста «Книга мормона» (The Book of Mormon) с помощью компьютера. Эта работа вызвала много споров. Результаты компьютерного анализа авторского стиля «Книги» дали возможность предположить, что ее действительно писал не один человек, то есть выдвигавшиеся ранее гипотезы, возможно, были верны. Исследование также подкрепило одну определенную теорию происхождения «Книги», которую церковь мормонов отвергла как ложную. Результаты анализа не давали сделать однозначное заключение, но отклики на статью, в том числе весьма интересное опровержение, сделанное мормонскими богословами из Университета имени Бригама Янга, показали, каким революционным орудием может быть компьютерный анализ текста.

Эта работа над определением авторства и «стилеметрией» убедила Мэтта в том, что компьютеры видят многое и помогают нам обнаружить в тексте то, чего мы обычно не замечаем. Дальнейшие исследования позволили Мэтту создать компьютерную программу, которая с точностью 82 % определяла пол автора всего лишь по его или ее манере использовать самые простые слова английского языка, такие как the[28] и of[29]. Мэтт не первым заметил, что у авторов-мужчин и авторов-женщин – разные стилевые привычки, но в своей работе он сосредоточился исключительно на романах XIX века. Затем он обнаружил, что, опираясь лишь на использование слова the, компьютер может достаточно уверенно определить, английский это писатель или американский.

Реакцию Джоди можно примерно описать словами «Ну и что?». Конечно, очень интересно, что компьютер может отличить британца от американца, но это – искусственная задача, решение которой никому не интересно. Чтобы убедиться в могуществе компьютерного метода, Джоди хотела увидеть, как с помощью машин решаются настоящие литературоведческие задачи. Мэтт же, в свою очередь, был не в восторге от того, что Джоди зациклена на современных бестселлерах. Он считал их одноразовыми поделками – прочел и забыл. Его надо было убедить, что в них скрыто золото, которое оправдает труды старателя.

Все это было несколько лет назад. С тех пор мы объединили свои силы и бросили их на доказательство следующей гипотезы: все бестселлеры характеризуются определенным набором скрытых сигналов, неким тайным кодом. Вместо того чтобы угадывать, какая книга окажется популярной, мы решили довериться тому, что читатели уже поняли, сами того не заметив. Список бестселлеров лишь на первый взгляд кажется случайной подборкой непохожих друг на друга книг – на самом деле это еженедельно обновляемый набор сигналов, на зов которых идет читатель, и этот набор постоянно уточняется посредством коллективного голосования. Учит ли чему-нибудь глас читающего народа? Смогут ли наши компьютеры выделить сигнал из этого шума? Есть ли у этих броских обложек – будь то высокоинтеллектуальные романы из университетской программы или чтиво для пляжа – что-нибудь общее?

Если ответ «да», то мы сможем узнать кое-что об анатомии успеха. Мы сможем даже опровергнуть распространенную в книжном мире теорию и создать алгоритм, позволяющий предсказать, станет ли та или иная книга бестселлером.

Итак, мы начали обучать компьютер чтению.

Машинное чтение

Конечно, компьютеры на самом деле не умеют читать, во всяком случае – в том смысле, в котором вы читаете эту страницу. Но можно также сказать, что они умеют читать в том смысле, в каком они умеют делать все остальное – они «считывают» текст, то есть принимают его в качестве входной информации. Затем они проводят разбор, то есть разбивают текст на единицы, которые мы, люди, считаем осмысленными: буквы, запятые, слова, предложения, главы и т. д. На этой стадии компьютер в значительной мере подражает человеку, и чем совершенней была обучающая программа, тем точнее подражание. Разница между читателем-человеком и читателем-машиной заключается в том, что человек понимает значение читаемого текста, а компьютер – нет. Ирония здесь, однако, в том, что компьютерный способ чтения позволяет нам вглядеться в текст пристальней любого самого опытного литературного критика. Все потому, что компьютеры – мастера различать детали в таком мелком масштабе, какой человеку и не снился.

Вспомним вопрос, с которого началось наше исследование. Можно ли предсказать заранее, что та или иная книга станет бестселлером? Чтобы предсказывать, нужно уметь обнаруживать закономерности. Если вы не умеете гадать на картах, то вся ваша надежда – на способность распознавать определенные характеристики текста. Обычно такими вещами занимаются литературные критики и ученые-литературоведы. Джозеф Кэмпбелл, великий специалист по мифологии, всю жизнь читал мифы и легенды разных народов мира и научился видеть в них схожие мотивы. Он был мастером по распознаванию повторяющихся узоров. Но даже если человек всецело предан своему делу, объем текстов, которые он может переработать, конечен, и столь же ограниченно внимание, с которым он исследует каждую отдельную книгу. Следовательно, в обоих направлениях мы сталкиваемся с ограничениями масштаба и как будто вынуждены одним глазом смотреть в микроскоп, а другим – в телескоп.

Еще один ученый, обладающий завидным трудолюбием, – Кристофер Букер – потратил тридцать лет на чтение сотен книг, чтобы выдвинуть следующую теорию: все литературные произведения и вообще все истории соответствуют семи основным сюжетам. Допустим, он трудился сорок лет и прочел тысячу книг. Допустим также, что из прочитанного он запоминал гораздо больше, чем средний человек. Но кластер компьютеров, обученных надлежащим образом, может прочитать несколько тысяч романов и проанализировать все эти тексты по тысяче параметров примерно за один день. При этом компьютеры обладают невероятной способностью замечать то, что мы, люди, принимаем как должное или вообще игнорируем.

Вот лишь один пример. Как читатели – особенно читатели, обученные пристально вглядываться в текст, – мы отмечаем прилагательные, которые использует писатель. Но, скорее всего, не обратим внимания на соотношение числа существительных и прилагательных, то есть на то, как часто автор использует прилагательное для описания существительного. А вот компьютер прекрасно приспособлен для того, чтобы замечать именно такие вещи – и они важны, поскольку определяют авторский стиль и манеру описаний. Компьютер может также вычислить это соотношение для данной книги и сравнить с тем же показателем у тысячи других книг. Если окажется, что у бестселлеров этот показатель в среднем выше (или ниже), значит, данный параметр имеет какое-то значение.

Предлагаю вам проделать небольшой эксперимент, когда будете в следующий раз выбирать книгу для чтения. Вместо того чтобы последовать рекомендации друга или выбрать книгу знакомого автора (или в любимом жанре), попробуйте взять недельный список бестселлеров NYT и прочитать их все по очереди. Можете это сделать вместе с книжным клубом, в котором состоите, или всей группой на курсе английской литературы. Если вы будете читать внимательно, то скоро уподобитесь нашим компьютерам и начнете замечать неожиданные параллели между литературными шедеврами и массовым чтивом, книгами «для мужчин» и «для женщин», Паттерсонами и пулитцеровскими лауреатами и т. п. Некоторые общие мотивы вас удивят. Например, вы зададитесь вопросом: почему так много книг, в которых главной героине двадцать восемь лет? Имеет ли это какое-то значение? Вы спросите себя, сознательно ли авторы помещают первую любовную сцену на страницу 200, если в романе 400 страниц, или на страницу 110, если страниц 220. Если да, то почему? Вы будете спорить с друзьями о том, определяется ли низкое качество романа, в остальном очень хорошего, отсутствием удовлетворительной развязки. Возможно, вы даже придете к выводу: бестселлеры всех категорий имеют столько скрытых общих черт, что фактически представляют собой отдельный жанр.

Интересно здесь то, как остро и притом незаметно для себя люди во время чтения реагируют на подобные характеристики книги. Специалисты из новой, стремительно развивающейся области «литературной неврологии» используют ЯМР-томографию для исследования мозга человека во время чтения. Эксперимент направлен на выявление того, что замечает читатель. Когнитивная психология подходит к вопросу «как читает читатель?» совершенно под иным углом, чем мы, но оба подхода базируются на одном постулате: отклик читателя на литературный текст зависит от того, из каких слов состоит этот текст, в каком порядке они выстроены и как организованы в предложения. И какую реакцию они вызывают.

Значит, использование компьютерного чтения никак не противоречит обычному подходу литературных критиков. Более того, рассмотрение характеристик текста «под лупой», их извлечение и последующий анализ очень часто используются в традиционных критических подходах и позволяют получить представление о тексте на уровне, который был невозможен раньше.

Компьютер можно научить читать текст и извлекать из него информацию множеством способов[30]. Алгоритмы и программы, созданные нами для данного исследования, направлены на обработку текстов и сбор детальной информации (о неповторимом стиле каждой книги, ее тематике, эмоциональных подъемах и спадах в повествовании, персонажах, местах действия). Также эти программы обрабатывают огромное количество скучных на первый взгляд лингвистических данных, которые не так просто перевести на язык привычных концепций стиля и сюжета. При обработке художественных произведений большого объема, какие обычно изучаются на курсах писательского мастерства и в пособиях для начинающего романиста (тема, сюжет, стиль и т. д.), обычно анализируются сотни параметров. Например, чтобы дать формальное описание стиля, мы использовали несколько сотен переменных: как часто у автора попадаются слова типа a[31], the, in[32], she[33]; как часто автор использует точки и восклицательные знаки; как часто – наречия и какие именно. Эти мелкие детали так много говорят читателю! Посмотрите, как важны местоимения для создания эффекта в знаменитой фразе из романа Шарлотты Бронте «Джейн Эйр»[34]: «Читатель, я вышла за него замуж». Компьютер обращает внимание на слово «него», на то, как часто мы слышим про «него» и как часто это местоимение встречается рядом с самым главным местоимением – «я» рассказчицы. Компьютер замечает, что «я» и «он» попадаются все ближе друг к другу во все большем количестве предложений, и их разделяет все меньше и меньше слов. Конечно, читатель тоже следит за этим. Разве главная развязка множества книг не заключается в том, чтобы «я» и «он» пошли по страницам рука об руку, разделенные лишь немногими важнейшими словами, такими как «вышла за»? Очень часто мы, не в силах оторваться от книги, продолжаем листать ее исключительно ради этого.

Вопросительные и восклицательные знаки тоже многое могут поведать. Возможно, вы помните, как писали сочинения в школе и как учитель советовал вам не злоупотреблять восклицаниями. Если каждая фраза визжит от возбуждения («О боже!»), или командует («Руки вверх!»), или кричит от боли («Ой!»), или жутко грохочет в подвале среди ночи («Бу-бух!»), то у читателя, не ровен час, может случиться сердечный приступ. Если текст изобилует восклицательными знаками, это кое-что говорит как о его возможном содержании и уровне накала страстей, так и о профессионализме автора. Аналогичным образом обилие вопросительных знаков указывает на то, что этот текст – диалог, а бесконечные страницы текста без единого вопросительного знака могут замедлить динамику повествования и притупить интерес читателя. Эти черты индивидуального стиля мы обсуждаем в 4-й главе.

Мы начали с извлечения свыше 20 тысяч параметров – имейте в виду, что количество восклицательных знаков и частота употребления слова «него» это лишь два из них, – и изучили их все. Некоторые были приметами стиля, другие помогали что-то узнать о сюжете и месте действия, а третьи поясняли, о чем, собственно, книга. Оказалось, что не все эти параметры помогают отличить книгу, набравшую миллионы читателей, от той, которая, несмотря на все свои уникальные достоинства, провалилась. Например, выяснилось, что использование чисел в заглавии – «911», «1984», «867–5309», «$ 1 000 000» – никак не стимулирует продажи. Аналогичным образом мы потратили много времени, обучая компьютер распознавать место действия (например, действие книги «Дьявол носит Prada»[35] происходит целиком в Нью-Йорке, а действие «Исчезнувшей» начинается в Нью-Йорке, а потом переносится в штат Миссури), но оказалось, что, за малыми исключениями, географическое положение героев совершенно не влияет на популярность у читателей. В Нью-Йорке происходит действие как бестселлеров, так и книг, не имевших никакого успеха. Литературные мегахиты, действие в которых разворачивается в этом городе, – взять хотя бы «Обнаженную для тебя» Сильвии Дэй, «Костры амбиций»[36] Тома Вулфа, «По-быстрому»[37] Джеймса Паттерсона, «Жутко громко и запредельно близко»[38] Джонатана Сафрана Фоера – явно (намеренно со стороны автора или случайно) обладают какими-то иными, более важными «генами бестселлера».

В конце концов мы отфильтровали свой список параметров, оставив от 20 тысяч примерно 2800, которые помогают отличить популярные у читателей книги от предназначенных для – будем честны – узкой читательской ниши. Сначала мы научили компьютеры читать книги и извлекать из них нужные данные, а затем проанализировали эти данные, используя другой набор компьютерных программ – для обнаружения и исследования скрытых закономерностей. В этой фазе анализа мы использовали процесс, весьма метко называемый машинным обучением. При анализе текстов бывает нужно сортировать или классифицировать их по сходству и различию. Например, мы хотим отличать спам от обычных сообщений в электронной почте. Поскольку у спамерских посланий много общего – искаженное написание слов, частое упоминание виагры и т. д., – можно написать программу, которая будет определять, с какой вероятностью данное сообщение окажется спамом. Сортировка романов на бестселлеры и небестселлеры очень похожа на действия, выполняемые спам-фильтром в электронной почте. Допустим, у нас есть новая книга, которую мы видим в первый раз, и мы хотим понять, может ли она стать бестселлером. Если у нас уже есть куча бестселлеров («не спам») и куча книг, которые бестселлерами не стали («спам»), мы можем ввести их все в компьютер и научить его отличать книги одной категории от другой по определенным параметрам. Именно так мы и поступили. Более того, мы проделали это тремя разными способами, усреднили результаты и обнаружили, что в 80 % случаев наша система правильно определяла, какой текст из нашего корпуса – бестселлер, а какой – нет[39].

Этот средний показатель 80 % означает, что, если взять наугад из недавно опубликованных книг 50 бестселлеров и 50 так и не ставших ими, наш компьютер правильно классифицирует 40 бестселлеров и 40 небестселлеров. Конечно, это значит также, что компьютер сочтет 10 бестселлеров провальными, а 10 небестселлерам напророчит блестящий успех. В проведенной нами серии тестов компьютер, в частности, был абсолютно уверен, что «Гордость и предубеждение и зомби»[40] не будет иметь успеха, – и ошибся. Конечно, «Гордость и предубеждение и зомби» вышла тогда, когда любая отсылка к Джейн Остин гарантировала книге внимание читателей, а в кинотеатрах пачками шли фильмы про зомби. Но в данном случае контекст оказал непропорционально большое влияние на уровень продаж.

Конечно, были еще и небестселлеры, которые наш компьютер превознес до небес, но это отдельная история.

Договор

Обсуждая новые романы, мы, авторы этой книги, часто говорим об отношениях читателя и автора так, будто существует некий неписаный договор – детали его туманны, но тем не менее он описывает эстетические, эмоциональные, интеллектуальные и даже этические причины, стоящие за выбором читателя. Обучая свою модель распознавать тему, сюжет, стиль и характеристики персонажей, мы много думали о том, чего ждет читатель от книги.

Этот неписаный договор содержит много статей. Если вы автор триллера, например, вы обязаны включить в него один-два трупа и сцену, в которой у читателя учащается пульс. Если вы пишете любовный роман, то он должен заканчиваться (но не начинаться) долгожданным воссоединением влюбленных. И независимо от жанра (если вы не новый литературный вундеркинд – им прощается двойная длина книги), у вас есть примерно 350 страниц, чтобы увести читателя куда-то далеко, а потом привести обратно. Таковы ваши основные обязательства, и вы наверняка видели, как брызжут желчью или роняют слезу читатели в отзывах на сайте goodreads.com, когда автор не оправдывает ожиданий.

Помня об этом, дорогой читатель, мы заключим с вами собственный договор, условия которого весьма прозрачны. Вот его статьи.

1. Номер первый

Одна из особенностей нашей культуры и книжного мира состоит в том, что мы обожаем ранжированные списки. Дело не ограничивается списком бестселлеров. В этом году в газетах и на сайтах крупных книжных сетей мелькали статьи с разнообразными заголовками вроде «Самые красивые места действия ваших любимых романов», «Десять самых влиятельных книг всех времен», «Выбери бойфренда среди литературных персонажей». Посетители сайта goodreads.com общими силами составили списки по самым разным темам: лучшие книги, действие которых происходит в космосе; лучшие японские издания; герои, оказавшие наибольшее влияние; книги, которые заставят вас всплакнуть. Этих списков тысячи. Книголюбам приятно составлять их, спорить о них и, конечно, сравнивать, с кем лучше пойти на свидание – с мистером Дарси или Кристианом Греем.

Не думайте, что у нас, авторов, иммунитет к составлению списков. Мы знаем, что всех, кто имеет отношение к книжному делу, просят порекомендовать любимую книгу. Если об этом спросили вас, ответ «У меня нет любимой книги» звучит смертным приговором – он убивает на корню и светскую беседу, и ваш авторитет профессионального читателя. Эти пять слов гарантированно действуют на собеседника как холодный душ. Так что мы участвуем в рискованной игре, поскольку понимаем, что в нашем мире номер первый решает все. Номер первый – это важно. Первый номер в списке бестселлеров NYT значит нечто гораздо большее, чем номер десятый. Возможно, именно потому, что современный мир предоставляет бесконечные возможности выбора, мы испытываем психологическую и культурную потребность – определить одного победителя, короля, бога. Выбрать что-нибудь одно.

К концу этой книги мы приведем собственный список рекомендованного чтения и назовем победителя – произведение, которое наш компьютер выбрал в качестве образцового, эталонного бестселлера последних тридцати лет.

2. Верьте нам, как мы доверились машине

Второе обещание, которое мы даем читателям «Кода бестселлера», – не «исправлять» выбор модели. Мы с самого начала согласились с тем, что наша задача – не выбирать, а объяснить выбор. По правде сказать, мы не читали «книгу номер один» до того, как ее выбрал компьютер, хотя и были знакомы с другими произведениями этого автора. Конечно, мы тут же схватили ее с полки, прочитали вместе и вместе посмеялись над неожиданной иронией. Мы советуем вам не перескакивать сразу к названию романа-победителя – каждая глава нашей книги объясняет очередной кусочек головоломки. Но в то же время мы знаем, какое это искушение – прочитать первую страницу и потом сразу же заглянуть на последнюю.

3. Волшебного чая не существует

Мы не утверждаем, что после первого же (или даже после второго) прочтения нашей книги вы сможете писать бестселлеры. Это вовсе не пособие «для чайников», и мы не даем никаких гарантий. Вы обязательно найдете на этих страницах множество полезных советов, которым мы сами непременно последуем, если решим написать бестселлер. И конечно, прежде чем сдавать агенту свое новое произведение, мы обязательно проведем компьютерный анализ текста. Но красота этой книги заключается еще и в том, что она позволяет пересмотреть старую аксиому, которая гласит: «писательское мастерство – дар, которому невозможно научить». Нам интереснее ниспровергать, чем обучать.

Почти все известные нам пособия для писателей (нам больше всего понравились написанные авторами книг-блокбастеров, такими как Дин Кунц и Стивен Кинг) дают советы по разным аспектам прозы: стиль, характер, сюжет. Мы делаем то же самое. Мы надеемся, что поможем вам заглянуть в глубины ДНК бестселлера, куда не проникает человеческий глаз, и препарировать это невыразимое je ne sais quoi[41], свойственное талантливым писателям. Но мы не дадим вам формулы, которую можно было бы применить. Эта книга поведает вам многое об анатомии бестселлера, но не поможет ее скопировать – как не помогут стать писателем отпечатки пальцев Адама Джонсона[42], даже если вы срежете кожу у него с кончиков пальцев и приклеите себе.

Возможно, вы сочтете нас возмутительно старомодными, но мы твердо верим: тот, кто хочет написать бестселлер, должен сначала изучить и уметь отличать хорошую прозу, используя для этого все доступные средства. Если наша книга окажется полезной и вы напишете бестселлер – пожалуйста, дайте нам знать. Мы обязательно купим его и подвергнем компьютерному анализу. Но не жалуйтесь, что вы искали простую формулу, чтобы отхватить миллионный контракт на роман, а мы вам ее не дали. Тот, кто предложит вам такую формулу, – шарлатан, ничем не лучше тех, кто продает волшебный чай для похудения, гарантируя «радикальную потерю веса за одну ночь».

4. «Черный ящик»

Эта книга – не про алгоритмы. Мы расскажем об основных параметрах, которые научились вычислять, и опишем в общих чертах наш метод, но перед вами не пособие по машинному обучению, автоматическому поиску документов или обработке естественного языка. По этим темам существует множество хороших учебников, а мы пишем о книгах, в основном о бестселлерах[43]. Мы хотим, чтобы вы задумались о себе как читателе или писателе, о задачах литературы, об авторах, которых вы любите или ненавидите, и даже об отношениях человека и машины. Мы расскажем вам о множестве результатов и интерпретаций того, как компьютеру удалось или не удалось определить бестселлеры и чему это нас научило, но мы будем говорить про «Щегла»[44] и «Исчезнувшую», а не про латентные размещения Дирихле или, к примеру, распознавание именованных сущностей. Эти (загадочные для непосвященных) методы были важны для проделанной нами работы, и без них мы не справились бы, но это лишь инструменты: живописец рисует кистью, но он не рисует саму кисть.

2. Крестные родители, или Почему важно находить время друг для друга

Входя в книжный магазин, первое, что видишь, – столы с новыми книгами. Теперь вы знаете: чаще всего это значит, что за многие из них, если не за все, кто-то хорошо заплатил, чтобы они первыми попались вам на глаза. Это произведения самых разных жанров – романы, автобиографии, кулинарные книги, триллеры, однако остальная часть магазина организована по категориям. Если вы любите читать беллетристику, то знаете, что в магазине обычно есть отдел прозы, где размещаются по алфавиту классические и современные авторы, а также отделы жанров с соответствующими табличками – например «Любовный роман» или «Научная фантастика». Мы так привыкли к подобному размещению книг в магазине, что, кажется, нашли бы нужную с закрытыми глазами.

Расположение книг как в магазинах сети Barnes & Noble, так и в любом онлайн-магазине продиктовано убеждением, что самая главная характеристика книги – это ответ на вопрос: «О чем она?» На этом построено все книжное дело. Каждой книге, опубликованной традиционным образом, присваивается один или несколько кодов тематики по классификации BISAC[45]. Они устанавливаются Группой исследования книжного дела (BISG) – ассоциацией, ответственной за создание и поддержание стандартов в отрасли. Этих кодов тысячи; для одной беллетристики их существует 152, и они определяют, в какую категорию попадет книга, как она будет выставлена на полке и как будет продаваться. Коды очень подробно описывают содержание книги – например «исторический любовный роман с участием викингов».

Для других характеристик, тоже важных читателю, – например книги со счастливым концом, книги, выжимающие слезу, книги, действие которых разворачивается в Токио, книги с участием пожарных, принцесс или монахинь, – такой всеобъемлющей системы классификации не существует. Нет кода, который бы указывал, является ли стиль книги минималистским (как у Хемингуэя), или более сложным (как у Дэвида Фостера Уоллеса). По расположению томика в определенном отделе магазина вы не узнаете, какого пола главный герой, стар он или молод, происходят ли описываемые события в Лондоне или в Гонконге.

В принципе, можно сказать, что самая важная информация о книге – это ответ на вопрос: «О чем она?» Если вы советуете подруге, что почитать, или если вы сами писатель и упомянули свою книгу в разговоре, вас тут же спросят: «О чем она?» Очень редко (если вы пишете исключительно биографии) у вас могут поинтересоваться, о ком она, или где происходит действие, или в какую эпоху. В первую очередь людей интересует тема. Поэтому возникает вопрос: существует ли беспроигрышная тема?

Наш компьютер считает, что такие темы есть, и авторы книг-блокбастеров с ними согласны. В своем труде «Как писать книги»[46] – одном из популярнейших среди вышедших за последние годы пособий по писательскому ремеслу – жанровый автор Стивен Кинг советует начинающим романистам взять хорошо знакомую им тему, а потом добавить «собственные знания о жизни, дружбе, отношениях, сексе и работе. Особенно о работе. Люди обожают читать о работе – бог знает почему». Это любопытное наблюдение насчет работы многое говорит о нашей культуре – и в данном случае наш компьютер более-менее согласен с ним. По поводу отношений Кинг тоже оказался прав. Впрочем, в том, что касается секса, он, как ни удивительно, ошибается (мы скоро вернемся к этой теме), и еще он играет дурную шутку с начинающими писателями, сообщая им, что «сантехники в космосе» – неплохой сюжет, который привлечет читателя. Не верьте.

Конечно, эта работа Кинга написана увлекательно и бойко, а его слова согласуются с мнением других писателей по поводу тематики. Но в конечном счете его советы оказываются не очень полезными. Такая скупость в советах начинающим писателям со стороны одного из самых коммерчески успешных авторов последнего столетия, вероятно, объясняется его убеждениями, которые он также выражает в своей книге. Во-первых, он пишет, что «беллетристы, и я в том числе, сами не очень понимают, что делают, – они не знают, почему у них вышло хорошо, если книга оказалась хорошей, или плохо, если она оказалась плохой». Эти слова, вероятно, продиктованы скорее скромностью, чем стремлением к истине, но от писателя с таким живым воображением вряд ли можно ждать аналитического разбора того, что приходит к нему само собой (в данном случае – нужные темы, взятые в правильной пропорции, так что результат привлекает массового читателя со всех концов света). Во-вторых, Кинг пишет, что преднамеренно выбирать кассовую тему – «моральная нечистоплотность». Это заявление тоже, скорее всего, продиктовано более скромностью, нежели правдивостью. Вряд ли авторы-мультимиллионеры не думают о том, какие темы будут иметь спрос, – особенно когда знают, сколько экземпляров книги нужно продать, чтобы оправдать ожидания издателя. Кроме того, это нечестно со стороны Кинга – обзывать морально нечистоплотным писателя, который разбирается в читательском спросе и хочет работать именно с популярными темами.

Мы здесь не для того, чтобы хвалить или порицать выбор автора с точки зрения морали. А также не для того, чтобы объявлять один роман хорошим, а другой плохим или одну тему более достойной для разработки, чем другая. Мы предоставляем этический выбор в процессе творчества самим творцам, а обязанность их судить – критикам. Наша же задача как литературоведов – находить новые ответы на вопросы и выводить на свет скрытые истины, надеясь, что в результате нечто смутное и неуловимое станет более понятным. Чтобы таким образом прояснить роль темы в литературе, мы сначала должны провести четкую грань между темой книги и ее предметом и показать, как они взаимодействуют, творя произведения удивительного искусства – словесности.

Зачем мы читаем?

Вспомните себя в старших классах школы. Впервые в жизни перед вами стояла задача – прочитать книгу и увидеть ее глазами литературного критика. Скорее всего, это были «Повелитель мух» или «Убить пересмешника»[47]. Вы помните, что вас просили определить разницу между темой и предметом. Вероятно, учитель искал добровольца, готового ответить на вопрос: о чем роман Уильяма Голдинга «Повелитель мух»? Нас, во всяком случае, об этом спрашивали – мы помним. Но вопрос был, разумеется, с подвохом. Тогдашние мы могли бы сказать, что эта книга – о группе мальчиков, оказавшихся на необитаемом тропическом острове; о том, как они самоорганизуются, выживают; как группа делится на фракции, одна из которых становится агрессивной и доходит до убийства. Темы романа – английские мальчики, необитаемые острова, охота, постройка хижин и т. д. Но наши учителя на этом не остановились. Они хотели научить нас более глубокому пониманию прочитанного. Они хотели, чтобы мы заметили «большие вопросы» в романе, те, которые касаются движений человеческой души, – вероятно, именно в их трактовке и состоит послание Голдинга читателю. Двигаясь в этом направлении, мы могли бы заключить, что «Повелитель мух» на самом деле о споре, что важнее – природа или воспитание, или о борьбе добра и зла, или о дружбе, или о том, к чему склонны люди в изолированной группе – скатятся ли они к состоянию дикарей или останутся цивилизованными. Если вы были способны все это сформулировать на уроке литературы, то, скорее всего, получили пятерку. Возможно, даже пятерку с плюсом – если смогли показать, как с помощью раскрытия тем, в основном благодаря подбору существительных и их употреблению в определенных повторяющихся группах, Уильям Голдинг, согласно своему замыслу, наглядно демонстрирует читателю общечеловеческие истины.

Теперь подумайте немного о том, почему вы читаете именно то, что читаете. В книжном деле царит убеждение, что читатели выбирают книгу из-за темы. Это даже кажется очевидным. Если вас спросят, какие книги вы любите, вы ответите: «про преступления», «про войну», «про секс», «про рыбалку». Это особенно заметно в нехудожественной литературе: люди читают книги по определенным темам. Самые популярные из них – еда и бизнес. Но многие читатели художественной литературы на самом деле объясняют свой выбор совсем другими причинами. Если вы спросите читателя, по какому принципу он выбирал последний прочитанный им роман, то в ответ можете услышать:

«Я выбрал эту книгу, потому что она про холокост».

«Я выбрал эту книгу, потому что мне сказали, что на ней душа отдыхает».

«Я слышала, что это замечательный новый автор».

«Я же читаю все новые романы Стивена Кинга!»

Иногда читатели объясняют свой выбор регалиями книги: «Я хотел прочитать новый роман Адама Джонсона, которому дали Пулитцеровскую премию». Порой – тем, что они собираются в отпуск в Париж, а действие выбранной книги происходит именно там, или тем, что после разрыва с любимым человеком хотелось почитать что-нибудь сентиментальное. Ну и разумеется, выбирают роман, «потому что он был в списке бестселлеров NYT». Мы понимаем, что тема – не единственный стимул читательского интереса. Однако она является важнейшим фактором в книжном деле, к тому же в ней заключены возможности развития каждого конкретного сюжета. Поэтому в данной главе мы выделим вопрос темы и покажем, как с помощью компьютера можно определить ее роль в создании бестселлера.

Ощущения при чтении романа вызываются исключительно словами, расставленными в определенном порядке. Слова – это «кирпичики», строительный материал языка. Многие из них – существительные, а подбор существительных в определенных пропорциях становится инструментом, с помощью которого авторы раскрывают определенные темы, а через них – предмет книги. Именно свойственное автору чувство меры и его умение соблюсти деликатный баланс в раскрытии темы мы можем исследовать с помощью компьютерного анализа. Компьютер помогает понять, как писатель использует инструменты, чтобы вызвать у читателя те или иные переживания.

Связь между предметом книги и переживаниями читателя описать легко. Возьмем, например, женщин, которые читают любовные романы – причем постоянно и исключительно их. Это не карикатура – такие читательницы действительно существуют, и их много. В прошлом году мы ездили на конференцию «Романтические времена», посвященную любовным романам. Это мероприятие продолжительностью в несколько дней кого угодно убедит, что любовь в самом деле правит миром. Мы встретили нескольких страстных поклонниц жанра, которые клялись, что читают по три-пять сотен любовных романов ежегодно. Как им это удается? Мы не знаем. Но дело не в их сверхчеловеческих способностях. Дело в том, что, когда люди глотают книги одну за другой, это может быть как их свободным выбором, так и зависимостью сродни наркотической, заставляющей их выбирать один и тот же жанр, – но это не обязательно связано с интересом к определенным темам. Да, конечно, открывая любовный роман, мы ожидаем увидеть что-нибудь про любовь и отношения – это часть неписаного контракта между читателем и автором. Но кроме любви и отношений там могут присутствовать абсолютно разные темы. В BISAC есть коды для любовных романов с участием вампиров и шотландцев; любовных романов действие которых происходит в эпоху Тюдоров или в Средние века; любовных романов в спортивном мире; эротических любовных романов – и это лишь несколько примеров. Возможно, существуют читатели-привереды, которые выбирают только любовные романы про оборотней с экстрасенсорными способностями (да, такая категория в BISAC тоже есть). Но с тем же успехом можно предположить, что есть люди, которые читают любовные романы ради определенного переживания, вызванного широкой направленностью книги (тема любви), а не какой-то узкой темой (например, вестерном). Какая разница, кто главный герой – вампир или ветеринар? Главное, чтобы он был прекрасен телом и душой.

Связь между предметом и ощущениями читателя – важнейший вопрос в исследовании, цель которого – раскрыть механизм коммерческого успеха в литературе. Сравним любовные романы и триллеры. Это две важнейшие категории для любого исследователя современного книжного мира, поскольку они продаются лучше всего. Они правят рынком – но разными его сегментами. С одной стороны, триллеры, похоже, все еще занимают более сильные позиции в списке NYT. Это особенно верно для книг в твердом переплете. С другой стороны, стремительно развивающийся мир электронного «самиздата» растет в основном за счет любовных романов. Это золотая жила для исследований – хватило бы на целую отдельную монографию: пассажиры в метро по дороге на работу читают знойные истории любви со смартфонов, а детективы – в бумажных изданиях; при этом среди любителей детективов примерно поровну мужчин и женщин, а вот среди читателей любовных романов женщины преобладают. Однако важный момент, интересующий нас сейчас, заключается в том, что любовные романы и триллеры вызывают у читателя сходные переживания в интеллектуальной и эмоциональной сферах и в том, что касается работы воображения. Любитель триллеров, скорее всего, покупает книги, в которых описаны пытки, шпионаж, проверки алиби, – потому что стремится попасть в мир, где людям угрожают, преследуют их и убивают. Соответственно, триллеры, не создающие атмосферу нависшей угрозы, вряд ли будут иметь успех. Триллер, посвященный рыбалке и термопечати на футболках, скорее всего, не захватит воображение читателя. Как читательница любовного романа жаждет читать о любви, так читатель триллера хочет читать в основном о преступлениях. Мораль ясна: если мы хотим понять, почему та или иная тема имеет успех у читателей, то нужно думать о том, как она действует на нас и совпадает ли это воздействие с нашими желаниями. Иными словами, совет Кинга «писать о том, что знаешь, плюс любовь, секс, работа и отношения» нуждается в существенном уточнении.

При построении компьютерной модели мы рассчитывали на то, что, исследуя темы подробней, чем это доступно обычному человеческому восприятию, мы сможем прийти к более глубокому пониманию тем, постоянно присутствующих в списках бестселлеров. И мы оказались правы. Поскольку в распоряжении писателя – все темы на свете, легко предположить, что бестселлеры – это книги про «секс, наркотики и рок-н-ролл». Но выяснилось, что это не так. Далеко не так.

Секс, наркотики и рок-н-ролл

Секс 0,001 %

Наркотики 0,003 %

Рок-н-ролл 0,001 %


Эти крохотные доли процента отражают присутствие каждой темы (в среднем) в современных романах из нашего корпуса текстов. Вероятно, эти показатели потрясли вас до глубины души. Сейчас мы объясним, почему они настолько низки, и, возможно, потрясем вас еще раз. Если взять набор из 500 тем и проследить их по всему корпусу из 5000 текстов, среди которых есть 500 бестселлеров, то в среднем описания секса в них будут занимать всего около одной тысячной доли процента. Если затем измерить тот же показатель (чуть позже мы объясним, как это делается) только среди бестселлеров, окажется, что доля секса в них еще ниже – 0,0009 %.

Удивительно. Кто бы подумал, что секс – не двигатель продаж? Когда мы об этом рассказываем, нам до сих пор не верят. Истина заключается в следующем: секс (точнее, эротическая литература) продается, причем в немалых количествах, но лишь на определенном, нишевом рынке. Книги этого жанра редко вырываются на основной рынок, который создает бестселлеры. Мы знаем, что вы сейчас подумали: «А как же “Пятьдесят оттенков серого”?» Этот роман (или эти романы, если говорить о всей трилогии) – чрезвычайно редкий пример эротического произведения, попавшего в бестселлеры. В следующей главе мы объясним причины этого успеха – и окажется, что они не имеют отношения к собственно сексу.

Вопреки видимости (учитывая навязчивое присутствие темы секса на ТВ, в кино и СМИ) читающая публика США в последние тридцать лет явно предпочитает другие темы. Сочетание тем, характерное для современного бестселлера, дает основания предположить, что современный читатель ждет от книги чего-то большего, нежели потакание самым низким инстинктам.

Но откуда мы это знаем?


В 1957 году лингвист Джон Руперт Фёрс сказал: лучший способ понять слово – это познакомиться с его соседями. Проще говоря, значение слова раскрывается через контекст, в котором оно употреблено. Слова «секс», «наркотики» и «рок-н-ролл», фигурирующие в названии этого раздела, можно было бы понять соответственно как сокращение слова «секстет», «обезболивающие средства» и «акробатические танцы» – но вы знаете, что в данном контексте имелось в виду не это, именно потому, что каждое из слов придает определенный оттенок смысла своим соседям. Возьмем другой пример – слово «три». Оно может означать числительное, а может – повелительное наклонение глагола[48]. Чтобы различать эти два случая, компьютер нуждается в специальном обучении – по принципу, сформулированному Фёрсом семьдесят лет назад. Компьютер должен рассматривать каждое слово в контексте окружающих его слов в ближайших предложениях. Алгоритмический метод для формализации такого рассмотрения слов в контексте в больших объемах называется моделированием тем[49].


Математический аппарат, задействованный в моделировании тем, весьма сложен, но его общие принципы достаточно просты. Каждый роман представляет собой комбинацию тем, а эти темы выражаются словами (в первую очередь – существительными). Например, в книге о финансах, скорее всего, встретятся слова «банки», «проценты», «деньги», «фидуциарный». В другой книге, посвященной домашнему консервированию, мы увидим слова «банки», «крышка», «огурцы» и «укроп». Слово «банки» попадается в обеих книгах, но, рассмотрев другие существительные, стоящие рядом с каждым вхождением этого слова, компьютерная модель регистрирует повторяющиеся закономерности и может понять – подобно читателю-человеку, – что в разных местах слово «банки» имеет разные значения[50]. Очевидно, что слово «банки» само по себе еще не тема, но, когда оно постоянно попадается рядом с другими словами, которые (как нам уже известно) связаны с финансами, мы понимаем, что компьютер обнаружил в книге тему денег. Аналогично, если «банки» окружены «огурцами» и «пряностями», мы знаем: компьютер обнаружил тему домашних заготовок. При написании этой книги мы проводили моделирование тем, и одна из тем, обнаруженных компьютером, выглядела так, как показано на рис. 1.


Рис. 1


Эта тема посвящена барам – не единицам измерения, а заведениям, куда заходят выпить рюмочку. Значение этого слова вполне прозрачно. На нашей визуализации в виде облака слова изображены шрифтом разного размера: чем крупнее шрифт, тем чаще это слово попадается рядом со словом «бар». Это очень логично. Слова, непосредственно окружающие центральное слово «бар», – «бармен», «выпить», «виски», «пиво» – дают нам уверенность в том, что если компьютер нашел все эти слова в пределах одной-двух страниц, то действие разворачивается в обычном местном баре.

Не все темы, обнаруженные компьютером, так легко интерпретировать. Иногда требуются познания в литературе и дар рассуждения. Время от времени приходится распознавать необычный язык, сконструированный автором фантастической саги, или малоизвестный диалект. Если тема составлена из таких слов, как аск, уолл на уолл, боллзы и амбрелла, вы будете долго напрягать брейнз[51], пока не догадаетесь, что все это – сленг из романа Энтони Берджесса «Заводной апельсин». Однако гораздо чаще тематическое облако выглядит примерно как на нашем рис. 2.


Рис. 2


Такие существительные, как глаза, рот, рука, голова, говорят о том, что тема имеет какое-то отношение к телу. Однако просто тело – недостаточно конкретное название. Тело может фигурировать, например, в описании сцены убийства, но это явно не наш случай. Образующие контекст слова на самом краю облака – поцелуи, наслаждение, улыбка, дыхание, постель, ритм, жар – указывают на то, что эта группа существительных описывает любовную сцену. Но это тоже слишком общее выражение. Любовные сцены бывают разные. Большинство писателей утверждает, что правильно описать секс – нелегкая задача, за которую они берутся безо всякого удовольствия. Каждый автор решает ее по-своему, с большим или меньшим успехом. В данном случае нужно заметить, что выбор слов указывает на довольно сдержанный стиль писателя – он явно не злоупотребляет грубостью или откровенностью. Словесные облака, созданные из описаний любовных сцен, показывают, что эти описания сильно различаются: от таких, которые можно не смущаясь читать вслух собственной бабушке, – до таких, какие выдержит лишь закаленный читатель.

Благодаря алгоритму моделирования тем мы получаем два важных результата. Во-первых, компьютер сообщает, какие темы есть в нашем корпусе текстов (в том числе – какие слова составляют каждую из них; примеры мы только что видели в словесных облаках слов «бар» и «тело»). Во-вторых, компьютер определяет долю содержания каждой темы в каждой книге. Мы задали список из пятисот возможных тем, так что вариации тематического состава могут быть огромны. Узнав эти пропорции, мы можем начать поиск закономерностей, типичных для бестселлеров. Это нечто вроде обратного конструирования. Возьмем в качестве метафоры тарелку супа. Компьютер сначала делит его на составляющие – мясо, бульон, капуста, лук, специи, – а затем тщательно измеряет количество каждого ингредиента.

Измерив таким образом содержание ингредиентов, мы начинаем задавать вопросы. Например, можно спросить, какие банки чаще попадаются на страницах бестселлеров – те, что с деньгами, или те, что с вареньем. Или какого типа описания секса чаще встречаются в бестселлерах – совсем откровенные или более сдержанные. Кстати, если вам интересно: чтобы попасть в список бестселлеров NYT, лучше выбирать банки с деньгами, а любовные сцены (если уж без них никак нельзя) – те, которые рисуют душевную близость, а не насилие. Откровенная сцена поможет попасть в бестселлеры, если она продвигает вперед сюжет и взаимоотношения между персонажами. Если сцена добавлена автором для «оживляжа» и на самом деле не нужна для развития сюжета, она, скорее всего, не поможет книге продаваться и, следовательно, лишняя. Возможно, это объясняет, почему доля сексуальной темы в бестселлерах немного ниже по сравнению со всем корпусом текстов.

Конечно, нельзя создать книгу из одной темы. Возьмем, например, «Там, где течет река»[52] Нормана Маклина. Можно сказать, что она – про рыбалку и про деньги, но она также про религию и про отношения между братьями. У каждого романа есть свой собственный тематический профиль, отражающий не только набор тем, направленный на создание определенного переживания у читателей, но и точную пропорцию, в которой эти темы появляются в романе. В плане тематики для успеха книги важно и то и другое. Можем ли мы, глядя на рукопись, понять, насколько ее тематический профиль обеспечит ей успех?

Легко предположить вслед за многими редакторами, что роман об убийствах, расследованиях и командном спорте скорее понравится массовому читателю, чем роман о коллекционировании рептилий, космических ракетах и университетской жизни. Но для настоящего прогноза нужно задаться вопросом: существуют ли темы, общие для большинства бестселлеров? И в то же время необходимо доказать, что эти темы реже встречаются в романах, которые в список бестселлеров не попадают. Это сложная задача. При поверхностном взгляде на любой недельный список бестселлеров кажется, что набор тем совершенно случаен и ничего общего в них нет.

Возьмем список за текущую неделю. Сейчас, когда мы пишем эти строки, на первом месте среди романов в твердом переплете стоит «Вне правил»[53] Джона Гришэма. В этом нет ничего удивительного – Гришэм и первое место в списке бестселлеров сочетаются так же органично, как картофельный салат и Четвертое июля. Вопрос, однако, в том, обусловлено ли первое место в списке темами, присутствующими в книге. Второе место занимает детектив Джеймса Паттерсона из серии про Алекса Кросса. На третьем месте – роман Тома Клэнси, написанный кем-то другим (Клэнси умер в 2013 году). Далее идет сборник рассказов Стивена Кинга, детектив Дэвида Балдаччи, любовный роман Николаса Спаркса и очередное творение Джанет Иванович об охотнице за головами. Все эти произведения можно так или иначе отнести к жанровой прозе. Поскольку книга Кинга не роман, а сборник рассказов, ей, вероятно, свойственно большее тематическое разнообразие, чем роману. А поскольку Кинг работает в жанре хоррора и саспенса, можно догадаться, что его темы будут отличаться от тех, что использует Джеймс Паттерсон. Дальше идет удостоенный Пулитцеровской премии «Весь невидимый нам свет»[54] Энтони Дорра, потом новое творение Митча Элбома (как обычно, «про духовность»). Потом Пола Хокинс с «Девушкой в поезде»[55], которая держится в списке уже сорок седьмую неделю, потом – старый-новый роман Харпер Ли «Пойди поставь сторожа»[56], детектив Майкла Коннелли, «Соловей»[57] Кристин Ханны (его действие, как и действие книги Дорра, происходит во время Второй мировой войны) и наконец – любовный роман Даниэлы Стил и очередная часть саги Джорджа Р. Р. Мартина.

Посмотрев на список, можно ли сказать, «о чем» все эти бестселлеры в твердом переплете? Очевидно – ни о чем в частности и в то же время обо всем. Но в нем есть и закономерности. Подсказкой может служить то, что Джордж Р. Р. Мартин – своего рода аномалия. Его книга стала бестселлером в конце 2015 года, вероятно, в большой степени благодаря колоссальному успеху телесериала «Игра престолов». По крайней мере, про этот роман можно сразу сказать, что его попадание в бестселлеры было неожиданным. Тридцать лет назад – другое дело, тогда жанр фэнтези был популярен. Сейчас же в моду вошел современный реализм.

Мы пишем эту главу за неделю до Рождества – сейчас люди покупают подарки, и понятно, что на первое место в списке выходят самые популярные авторы. Поэтому задача распознавания тем слегка упрощается по сравнению с остальными неделями года. По-видимому, доминирующая тема – преступление. За ней идет война, которую можно назвать старшей сестрой преступления. В романах Спаркса и Стил, как и следовало ожидать, главная тема – любовь, но в аннотациях упоминаются отношения, грозящие героине опасностью, и смерть любимого человека. Так что и здесь не все безоблачно. Стивен Кинг (если не заболел) наверняка написал, как обычно, полный саспенса ужастик. В общем, несмотря на разнообразие (впрочем, не чрезмерное) тематики в списке этой недели, можно, вероятно, заключить, что основные темы, приводящие книгу в список бестселлеров, – насилие и страх. На этом мы могли бы завершить свой краткий анализ, сделав вывод, что удивительное культурное явление под названием «список бестселлеров NYT» отражает одержимость современного американского общества темой насилия (так что психиатры и социологи в этой стране еще долго не останутся без работы).

Надо сказать, что ни один из нас не собирается оспаривать этот вывод. Кроме того, ни один из нас не является дипломированным социологом. Раз уж мы пришли к этому выводу, мы его обнародуем. Но если вы решили срочно поменять профессию, пойти в литературные агенты и отбирать книги исключительно по наличию в них темы насилия, лучше погодите; давайте вместе рассмотрим менее очевидные закономерности, отраженные в этом списке.

При первом же взгляде на список бестселлеров в мягких обложках видно, что здесь ситуация несколько иная. Из десяти лидеров продаж преступлениям посвящена только одна книга. Это опять роман Джеймса Паттерсона об Алексе Кроссе, но уже другой: Алекс Кросс вынужден бросить семью за рождественским столом и бежать выручать заложников. Надо сказать, что в списке бестселлеров в мягкой обложке доминантная тема не просматривается вообще. На первом месте «Марсианин» – книга о покорении Марса, популярности которой очень способствовал успех фильма с Мэттом Деймоном. На втором – старая книга Филипа К. Дика (про Вторую мировую – но в альтернативной истории, где союзники войну проиграли). Два-три романа про жизнь женщин, любовь и дружбу. «Алхимик»[58] Пауло Коэльо, аллегорический роман о странствующем пастухе, находится в списке – потрясающе! – уже 383 недели. «Первому игроку приготовиться»[59] – книга Эрнеста Клайна о компьютерном игроке в виртуальной реальности. Ее тоже сейчас экранизируют. В четырех романах – Филипа К. Дика, «Все, чего я не сказала»[60], «Поезд сирот»[61] и «Бруклин»[62] – действие происходит в ХХ веке, но в разные десятилетия. Может быть, ключ к мегауспеху – не насилие, а историческая тематика? Даже если это и так, ее все же маловато для обобщения: четыре книги – это не десять. Что же это все-таки за тема, общая для всего списка? Может быть – путешествие?

Пока ясно только одно: во всех книгах списка персонажам приходится нелегко. Но чтобы обнаружить закономерности, нужно в первую очередь наблюдать за фактами и проверять гипотезы. Давайте шутки ради скажем, что если издательство намерено выложить несколько миллионов долларов за новый бестселлер, то, судя по этому списку, он должен быть о путешествии, которое главный герой совершает против своей воли или в страхе. Пожалуй, на сегодняшнем рынке такая книга имеет хорошие шансы на успех. И конечно, это предоставит редактору большую свободу действий, поскольку книга, соответствующая этому описанию, может быть и любовным романом, и триллером, и фантастическим романом, и произведением серьезной литературы. Этот сюжет можно отдать на разработку разным писателям и получить множество непохожих книг, несущих читателю разные послания, – поэтому все бестселлеры кажутся различными, хотя, как мы скоро увидим, в каком-то смысле они сходны.

Вот важный вывод из этого блиц-анализа, который следует запомнить: тема шире границ жанра. Первое, что нужно сделать, если вы хотите писать, публиковать или распознавать бестселлеры, – вообще забыть о понятии жанра, несмотря на его роль в книжном деле. Свадьба и супружеская жизнь могут фигурировать в книге любого жанра. Любовь и преступление – тоже. Пропорции тем в разных жанрах могут отличаться, но важно, чтобы где-то в тексте эти ключевые темы были. Вся проделанная нами работа доказывает, что концепция жанра подобна смирительной рубашке. Забудьте о ней. Если вы готовы взять на вооружение подобный образ мыслей, значит, вы уже начали мыслить как наш компьютер, строящий прогностическую модель.

Проверка

Для каждой книги в нашей коллекции были вычислены процентные значения, указывающие на содержание в ней той или иной из 500 тем, попавших в наш список. Конечно, в некоторых книгах какие-то темы не появляются вообще – например, в «Коде да Винчи» нет ковбоев. Но для каждого текста мы получили диаграмму вроде той, что изображена на рис. 3. Эта диаграмма – для книги Джоди Пиколт «Последнее правило»[63]: 23 % объема занимает тема, которую мы условно назвали «Дети и школа», 10 % – «Преступления», 7 % – «Судебные процессы и юридические вопросы», 6 % – «Домашние дела» и 2 % – «Близкие отношения».


Рис. 3. Основные темы романа Джоди Пиколт «Последнее правило»


После того как наш компьютер выделил основные темы, каталогизировал их и определил пропорцию каждой темы в каждой книге, мы обработали случайно выбранное подмножество результатов с помощью алгоритма машинного обучения, которому было заранее известно, какие книги в коллекции являются бестселлерами, а какие – нет. Используя эту информацию, программа подсчитала, какие темы и в каких пропорциях наиболее вероятно встретить в случайно выбранном бестселлере. Более того, эта же программа может определить, в использовании каких тем наиболее ярко проявляется различие между бестселлерами и небестселлерами.

Хороший пример – тема секса, о которой мы уже говорили раньше. В среднем она возникает в небестселлерах вдвое чаще, чем в бестселлерах. Компьютер способен уловить эту разницу и использовать полученные данные, чтобы спрогнозировать вероятность успеха доселе неизвестной рукописи. Согласно нашей модели, книга, в которой секс фигурирует почти в каждой главе, имеет мало шансов стать по-настоящему популярной. Конечно, из этого принципа есть исключения – трудно не заметить Сильвию Дэй или Э. Л. Джеймс, – но два автора не могут заметно повлиять на общие результаты исследования тысячи книг.

В конце концов наша компьютерная модель научилась на основании тематического профиля предсказывать с точностью 80 %, станет ли книга бестселлером[64]. И когда мы спросили модель, каким авторам за последние 30 лет лучше всего удавалось (преднамеренно или инстинктивно) использовать нужные темы в правильной пропорции, компьютер назвал два имени: Джон Гришэм и Даниэла Стил. Это нас как громом поразило. Наша реакция была вызвана не столько мнением по поводу их творчества – на тот момент мы еще не слишком пристально изучили их тематический «геном», – сколько тем фактом, что наша модель смогла выявить двух самых успешных писателей в истории человечества. Из всех их произведений она выбрала несколько самых, на ее взгляд, перспективных. Среди книг Стил это оказались «Неожиданный роман»[65], «Благословение»[66] и «Жить дальше»[67]. У Гришэма – «Противники»[68], «Юрист»[69] и «Джо из Калико»[70].

Подходящие герои

Мы прозвали Даниэлу Стил и Джона Гришэма «крестными отцом и матерью» современного бестселлера – в частности, потому, что за последние несколько десятилетий их книги неизменно входили в список NYT. Их общий вклад огромен. Их преданность писательскому делу вдохновляет. Их работоспособность чрезвычайно высока. Их капиталов, заработанных писательским трудом, вероятно, хватило бы на раскрутку сотни или даже тысячи молодых литераторов. Еще мы зовем их «крестными» потому, что в книжном мире они представляют собой образцы для подражания, которые словно олицетворяют собой Великую Американскую Мечту.

Когда читаешь их биографии, кажется, что перед тобой герои увлекательного романа. Даниэла Фернандес Доминика Шулейн-Стил родилась в Нью-Йорке (единственный ребенок в семье). Отец происходил из богатой династии пивоваров; мать, ослепительная красавица, была дочерью португальского дипломата. Еще в детстве Даниэла наблюдала роскошную и разгульную жизнь великосветского общества и начала писать стихи и рассказы. Когда ей было всего семь лет, ее родители развелись, и она жила то в Париже, то в Нью-Йорке – воспитывал ее в основном отец, другие родственники и слуги. Мать она почти не видела. Даниэла поступила в школу дизайна, собираясь стать модельером, но от слишком напряженной учебы у нее открылась язва желудка. В восемнадцать лет Даниэла вышла замуж за первого из череды богатых и влиятельных мужчин, обеспечив себе роскошную жизнь. Но Даниэла хотела и начала работать в области пиара и рекламы. Один из клиентов подал ей идею писать книги. В начале 70-х она удалилась в свой шикарный особняк в Сан-Франциско и начала работу над первым романом. Вспоминая об этом, она рассказывает, как писала в комнате для стирки, на крышке стиральной машины, чтобы не разбудить семью.

Джон Рэй Гришэм-младший родился в 1955 году в Арканзасе. Отец его был строительным рабочим – он скитался по всему американскому югу, переезжая вместе с Джоном и его четырьмя братьями и сестрами туда, где была работа. Ни отец, ни мать Джона не учились в университете, и денег в семье не было. Когда Джону было двенадцать лет, семья осела в штате Миссисипи. Как и Стил, Гришэм мечтал о карьере, ничего общего не имеющей с писательским делом. В старших классах он был подающим надежды спортсменом, звездой бейсбола. Он надеялся пойти в профессиональный спорт, но позже передумал и начал изучать бухгалтерское дело и налоговое законодательство. Он стал «уличным адвокатом» – юристом, представляющим интересы людей, а не корпораций, – женился на школьной подруге (они до сих пор вместе) и родил с ней двоих детей. Он не думал о писательской карьере. Но потом он решил наблюдать за выступлениями дорогих адвокатов в суде и однажды оказался на заседании, где слушались показания десятилетней девочки: ее избили, изнасиловали и бросили, сочтя мертвой. Эта трагическая история произвела очень сильное впечатление на Гришэма, и он задумался о том, что было бы, если бы отец девочки убил насильника. Потом он стал думать: что, если бы дело происходило на американском юге и насильник бы был белый, а отец-мститель – чернокожий. Этот случай не шел у Гришэма из головы, и наконец он решил сесть и записать все свои мысли, просто чтобы посмотреть, не получится ли книга. Три года подряд он ежедневно просыпался в пять утра, чтобы поработать над книгой, прежде чем начнется обычный день адвоката – в общей сложности семьдесят рабочих часов в неделю.

Разве эти две биографии – не образцовые сюжеты великосветского любовного романа и блокбастера? Можно сказать, герои этих историй были обречены на успех. Впрочем, ни к кому из них успех не пришел за одну ночь. Десятки лет спустя оба писателя подчеркивали в интервью, как важно быть настойчивыми и упорно трудиться. В конечном счете это единственный путь к Великой Американской Мечте.

Первая книга Стил, «Возвращение»[71], была опубликована в 1973 году и разошлась довольно быстро. Стил работала по восемнадцать-двадцать часов в день и вскоре написала еще пять книг, но никак не могла найти для них издателя. Писательница твердо решила не сдаваться и наконец нашла покупателя на свою седьмую книгу. Этот роман – ее вторая по счету публикация – вышел в 1977 году. С тех пор Стил написала еще почти сотню романов (не считая книг для детей и документальной литературы), и каждый из них становился бестселлером.

Книга Гришэма, написанная по материалам дела об изнасиловании, сначала называлась «Похоронный звон», а потом – «Время убивать». Ее отвергло множество агентов и редакторов, и наконец Дэвид Гернерт – последний из длинной вереницы агентов, к которым обращался Гришэм, – согласился работать с рукописью и обошел двадцать шесть издательств. В двадцать шестом ее взяли. С Гришэмом заключили контракт на 15 000 долларов. Книга вышла тиражом в пять тысяч и почти не продавалась (по слухам, сам Гришэм купил тысячу экземпляров). Но он продолжал писать. Его вторая книга называлась «Фирма»[72]. Сначала ему удалось продать права на экранизацию – за 600 000 долларов, а вскоре после этого и саму книгу за 200 000. С момента публикации в 1991 году «Фирма» около сотни раз фигурировала в различных списках бестселлеров.

И Стил, и Гришэм стали завсегдатаями этих списков с начала своей писательской карьеры и оставались в них год за годом. Статистические показатели несколько варьируются от одного источника к другому, но в любом случае у Гришэма и Стил тиражи больше, чем у любого другого из ныне живущих писателей. Стил часто называют четвертым по счету из самых популярных авторов всех времен и народов – после Шекспира, Агаты Кристи и Барбары Картленд. Около 130 ее книг выходили в общей сложности в 69 странах на 43 языках. В 1989 году она попала в Книгу рекордов Гиннесса за то, что ее роман оставался в списке бестселлеров NYT в течение 381 недели! По оценкам специалистов, общий тираж всех ее произведений составил 600 миллионов.

Список книг Гришэма гораздо скромней (их всего 35), но его литературная карьера развивалась беспрецедентным образом: в первые же годы он умудрился занять сразу четыре главные позиции в списках бестселлеров – номер первый в списке бестселлеров в твердом переплете и номера с первого по третий в списке бестселлеров в мягкой обложке. За это Гришэма прозвали самым быстропродающимся романистом в истории книжного дела. Он с самого начала практически застолбил первый номер в годовом списке бестселлеров Publishers Weekly. За 90-е годы его книги разошлись общим тиражом 61 миллион. Даниэле Стил за это десятилетие удалось продать 37,5 миллиона экземпляров своих книг.

Кто бы из них ни победил в этой гонке – думаю, вы согласитесь, что это не важно, – оба они добились успеха как литераторы. И какого успеха!

Но почему?


Ясно, что это очень важный момент: компьютер, прочитавший несколько тысяч современных романов и ничего не знающий о репутации писателей, выбирает именно Даниэлу Стил и Джона Гришэма как наиболее вероятных авторов бестселлера на основании того, как они понимают тему и предмет книги. Шансы каждого отдельного автора быть выбранным – исчезающе малы. Количество всех возможных комбинаций всех возможных тем в самых разных романах астрономически велико. Как же получилось, что наша модель выбрала двух из небольшой кучки потрясающе успешных авторов за последние тридцать лет?[73] Неужели взрывной успех Стил и Гришэма был с самого начала заложен в «гены» их рукописей? Ответ, по всей вероятности, «да». Но тут возникает еще один вопрос: как вышло, что наш алгоритм объединил в одну группу двух таких непохожих писателей? Несмотря на то что один пишет триллеры, а другая – любовные романы, что-то – касающееся именно тематики – они должны делать одинаково.

Если вычислить содержание тем во всех книгах обоих авторов, то окажется, что Стил и Гришэм явно руководствовались формулой «пиши о том, что знаешь». В книгах писателя, который мечтал о бейсбольной карьере, а потом стал юристом, главная тема – «юристы и юриспруденция», а за ней следует «американский командный спорт». Стил, у которой на счету пять браков, девять выросших детей и один погибший, пишет в основном на темы «семейная жизнь», «любовь» и «материнство». Сама Стил утверждает, что в книгах затрагивает самые разные темы – мировые войны, Уолл-стрит, индустрию моды, болезни, взаимоотношения братьев и сестер, растрату, аборт, – но мы выяснили, что это разнообразие проявляется лишь в малых дозах. Исследуя тематический состав книг Гришэма и Стил, мы видим, что у каждого из «крестных родителей» есть одна тема, которая пронизывает все их творчество и прочно ассоциируется с каждым из них. Наша компьютерная модель обнаружила множество данных, подтверждающих, что это очень мудрый подход.

Мы уже говорили о неписаном договоре между читателем и писателем – о том, чего ждет читатель, открывая книгу любимого автора. Часть этого договора касается тем. И Гришэм, и Стил постоянно выполняют свои обязательства по договору, причем неизменно в одних и тех же пропорциях. Примерно треть абзацев во всех книгах Гришэма описывает работу юридической системы. Аналогичным образом почти ровно треть абзацев в книгах Стил посвящена домашней жизни, или, точнее, времени, которое человек проводит внутри дома. Здесь нужно сделать несколько важных замечаний. Эти авторы известны своей «фирменной» темой, и читатели именно ее от них и ждут. Если автор пишет по роману в год и главной теме отведена примерно треть объема, остальные две трети можно занять другими, благодаря чему каждая новая книга немного отличается от предыдущих. Эта формула позволяет работать бесконечно долго, и теперь мы понимаем скрытую в ней мудрость: все дело в пропорции. Треть – привычного и ожидаемого, две трети – нового.

Мы стали разрабатывать этот вопрос дальше и обнаружили интересную закономерность, характерную для всех бестселлеров, а не только для произведений Стил и Гришэма. Оказалось, что все успешные авторы отводят именно такой объем, 30 %, под одну или две темы, а прочие авторы пытаются втиснуть в книгу как можно больше идей. У автора-середнячка на треть романа приходится как минимум три темы (а зачастую и больше). На 40 % бестселлера возникает всего четыре темы, а на 40 % небестселлера – в среднем шесть тем. Вам кажется, что мы бомбардируем вас цифрами? На самом деле связность повествования очень важна для воздействия на читателя. Чем меньше тем понадобилось автору для раскрытия важнейшего момента в сюжете – тем проще и ему, и читателю сосредоточиться на главном. Это означает отсутствие ненужных отступлений и говорит о том, что автор лучше организован и точнее мыслит. Это – показатель опытности писателя.

Мы проверили свою находку на двух знакомых – литературном агенте и романисте. Оба рассказали, что после серии неприятных отказов от издательств пришли к следующему выводу: неопытные писатели не рассчитывают свои силы. По словам наших знакомых, такие авторы пытаются описать сложную ситуацию со всех сторон и потому вынуждены использовать чрезмерное количество тем. Писатели – наблюдатели, и для них естественно стремление поделиться всем, что они знают о движениях человеческой души. Создание столь богатого темами романа может быть весьма приятным интеллектуальным упражнением, но рынок такие книги, как правило, не приемлет. Слишком много втиснуто в 350 страниц. Гораздо лучше не разбрасываться: во-первых, это придаст повествованию глубину, а во-вторых, читателю будет легче следить за сюжетом. Роман не обязан быть энциклопедией. Темы служат основой для развития характеров персонажей и эмоциональных переживаний читателя, но не должны затмевать ни то ни другое.

У Гришэма и Стил – всего по одной «фирменной» теме, которая занимает в среднем треть каждого романа. Вероятно, это помогает созданию определенной авторской репутации. Каждый из писателей использует также много других тем, но всегда – в малых дозах. Вторая в творчестве Гришэма тема, «американский спорт», занимает в его книгах всего 4 %, да и то эта средняя цифра заметно выросла только из-за романа «Джо из Калико» – единственного триллера Гришэма, действие которого не связано с юриспруденцией и полностью происходит в мире бейсбола. Другие вторичные темы Гришэма вполне ожидаемы: это деньги (3 %), работа полиции (2 %) и разведывательных служб (2 %). Но есть еще одна тема, которая бросается в глаза намного меньше, но при этом занимает в книгах Гришэма 4 %. Мы намеренно дали ей расплывчатое и непримечательное название – «заурядные моменты». Сцены, относящиеся к этой теме, описывают, например, как два человека беседуют, или сидят на диване перед телевизором, или идут по улице. Ничего особенного не происходит – просто жизнь. То, что эта тема у Гришэма занимает третье место после юриспруденции и спорта, важно – хотя бы потому, что показывает, как умело автор управляет темпом рассказа. Обычные, повседневные дела героев нужны для того, чтобы слегка разбавить напряженность сюжета и избежать чрезмерного драматизма. Вряд ли кто-то из читателей сознательно ожидает увидеть в книге подобные сцены, но если их не будет – если читателям не на чем будет перевести дух и подумать, – они наверняка начнут жаловаться.

У Гришэма есть и другие второстепенные темы, более очевидные и ожидаемые. Они занимают в его книгах примерно тот же объем, что и работа суда и полиции: это домашняя жизнь (для Стил – главная тема), летние каникулы (типичные слова – «веранда» и «велосипед»), отношения (тоже одна из главных для Стил) и семья.

Судя по тематическому профилю, герои Стил живут совершенно в ином мире, чем герои Гришэма. После темы домашней жизни (по выбору существительных видно, что речь идет о типичном отдельном доме типичной нуклеарной семьи) Стил отдает 5 % близкой теме, которую мы назвали «в семейном кругу». Существительные этой группы описывают повседневную жизнь: ужин, разговоры, отдых, любовь, выходные. Пока что особого драматизма не заметно. Однако третья самая частая у Стил тема – больницы и лечение. В группу этой темы входят такие слова, как «медсестры», «врачи», «скорая», «приемный покой», «несчастный случай». Здесь речь идет не столько о хронических болезнях и вынужденном долгом пребывании на больничной койке, сколько о внезапных, неожиданных происшествиях, нарушающих мирное течение семейной жизни. Эта тема занимает 13 % в «Поцелуе»[74], 12 % в «Жить дальше» и 8 % в «Неожиданном романе» – книгах, обычно получающих самую высокую оценку поклонников на сайтах, посвященных творчеству Стил.

Противопоставление домашней жизни и приемного покоя больницы очень важно; у Гришэма соотношение этих тем обратное, но результат их взаимодействия – тот же. Вспомните, как после описания юридических вопросов Гришэм показывает нам жизнь детей в семье и сцены личных отношений. Этот контраст, невысказанный конфликт – прекрасное топливо для динамичного развития сюжета. Больница и суд – места, где разыгрываются драмы, где над обычным человеком нависает угроза (мнимая или реальная). Как раз этих двух вещей – несчастного случая и преследования по суду – боится средний читатель, так как они могут положить конец и его собственному благополучию, и благополучию близких. Нас охватывает внезапный порыв – желание защитить вымышленную автором семью. Такова человеческая природа. Мы хотим знать, что станет с этими людьми. Все ли кончится хорошо? Как именно?

Вот чему учат нас «крестные родители»: в бестселлере должна быть доминирующая тема, скрепляющая его в единое целое, а менее объемные темы должны вступать с ней в прямой конфликт, содержащий в себе угрозу для героев. Не стоит использовать набор никак не связанных друг с другом разнородных тем: например, если основная из них – сексуальность, не стоит в качестве второй брать садоводство. Здесь нет потенциала для драмы, которая захватит читателя. Авторы бестселлеров выбирают сочетания тем, гарантированно вызывающие интерес у читателя, – например, дети и оружие, религия и секс, любовь и вампиры. (Наверняка среди бестселлеров найдутся романы с каждой из этих комбинаций.)

Третий важный момент для современного бестселлера: автор должен придерживаться реализма. Темы всех виденных нами до сих пор бестселлеров не имеют ничего общего с фантастикой. Это книги не про инопланетян, а про таких же людей, как мы; не про другую жизнь, а про нашу. Опытный писатель знает, какие темы наверняка занимают массового читателя, и пользуется этим. По крайней мере одна из основных тем романа должна затрагивать страхи множества людей – разных возрастов, полов, культур. Возможно, наша полушутливая гипотеза о путешествии, совершаемом под угрозой, была не такой уж глупостью.

И последний важный урок, который преподают нам Гришэм и Стил по поводу тем: нужно ориентироваться на мейнстрим. Чтобы книга разошлась миллионным тиражом, ее тематический профиль должен обладать определенным потенциалом для привлечения широкой публики. Возможно, вы как читатель или писатель предпочитаете что-нибудь неизбитое, экзотическое – например, проблемы шведской политики, как в «Девушке с татуировкой дракона», или историю искусства, как у Дэна Брауна, или мир высокой моды, как в книге «Дьявол носит Prada». Это всё хорошие темы, но факты – упрямая вещь, а согласно фактическим данным исследований, эти темы следует сделать второстепенными, поставив на первое место более универсальные, интересные для всех.

Часть успеха Гришэма и Стил кроется в их тематических профилях, состоящих в основном из тем, наиболее актуальных для общества на момент публикации романа. Появление книг Гришэма, ведущая тема которых – юриспруденция, совпало с возникновением судебного процесса как явления культуры и пиком популярности фразы: «Увидимся в суде!» Сегодня для всех классов общества зал суда играет ту же роль, что когда-то поле рыцарских поединков. Это стадион, куда приходят наблюдать за эпохальными битвами в области культуры и этики: здесь решаются вопросы равноправия женщин, межрасовых отношений, однополых браков, социальной ответственности корпораций, охраны окружающей среды. Вспомните о нашумевших судебных делах, о подробнейших репортажах из зала суда. Подумайте о том, как бремя личной ответственности и обязанности жить в мире с ближними переместилось с плеч каждого отдельного человека на плечи безликой правоохранительной системы. Юридическую систему США называют великим уравнителем; как радуется широкая публика, видя сделанные при арестах фотографии богачей и знаменитостей! Но одновременно с этим систему охраны закона все время называют рассадником коррупции. Следовательно, все, что связано с юриспруденцией, – отличная современная тема для любого писателя, даже если он далеко не так талантлив, как Гришэм. Эта тема так хороша, потому что в ней уже кроется конфликт: с одной стороны, она обещает справедливость, а с другой – таит в себе угрозу. Она идеально подходит для разговора о важных и насущных вопросах современности.

Во многих интервью Гришэм предостерегал начинающих авторов от слишком явного выражения своих политических симпатий в книгах – этим можно отпугнуть многих читателей. Сам Гришэм – открытый сторонник Демократической партии США, но в размышлениях по поводу своего романа «Дело о пеликанах»[75] он отметил его чрезмерную политизированность и сказал, что, как правило, старается не перегружать свои книги политикой, чтобы не оттолкнуть читателей с иными, чем у него, взглядами. Вероятно, это объясняет, почему и у него, и у Стил в тематическом профиле практически отсутствуют, например, религия, ведьмы, тяжелые наркотики и откровенные описания секса. Оба автора уделяют большое внимание вопросам этики и темам, вызывающим сильный эмоциональный отклик, однако потенциально конфликтные темы в их произведениях сведены к минимуму. Книга – не ораторская трибуна, а оскорбление чувств читателей – не лучшая стратегия, если ваша цель – миллионные контракты с издателями. Зачем отталкивать людей, если без этого можно обойтись? Их эмоции лучше обернуть себе на пользу.

Даниэла Стил точно знает, какие темы вызывают резонанс в читательской душе. На первый взгляд кажется, что она пишет обо всем подряд. Но если прочитать несколько ее книг одну за другой, вырисовывается обобщенная фигура главной героини: это женщина, строящая свою жизнь в современном мире, где перед ней теоретически открыты все дороги. Героини Стил часто оказываются перед выбором, непредставимым для женщин прошлых веков, и в тяжелых ситуациях, на которые не могут повлиять. Они размышляют и принимают непростые решения по поводу карьеры, детей, замужества и т. п. Стил пишет о суррогатном материнстве, абортах, конкуренции, матерях-домохозяйках, разводах и супружеских изменах, профессиональном росте женщин. Таким образом она, во-первых, разрабатывает актуальную для общества тему – выбор, стоящий перед современной женщиной, и открытые ей пути, – а во-вторых, может бесконечно варьировать комбинации, выбирая каждый раз другую второстепенную тему.

Однако все это не до конца объясняет, почему Стил и Гришэм заняли первое место по мнению нашего компьютера. Построенная нами модель показала, что эти авторы используют сходный набор вторичных тем – и при этом полностью избегают некоторых других. Полный список был бы очень длинным, но достаточно сказать, что Гришэма и Стил роднит приверженность реализму и оба стараются сделать так, чтобы читатель мог отождествить себя с героями книги. Для этого они используют такие темы, как родительство, семейный завтрак, укладывание детей спать, – и оба тщательно избегают всевозможных змей, волшебников, пещер и орков.

Но, пожалуй, самое интересное сходство между Гришэмом и Стил – это наиболее распространенная в их книгах тема, именно та, которую наш компьютер выделил как самую полезную для выявления бестселлеров. Это не значит, что данная тема в бестселлерах преобладает: ведь она при этом может быть преобладающей и для небестселлеров. Это значит вот что: содержание данной темы в бестселлерах значительно выше, чем в небестселлерах, а значит, ее можно использовать для предсказания успеха книги. Можно сказать еще проще: это тема, которой писателям не следует пренебрегать. В ней нет ничего экзотического, она обманчиво проста по сравнению с щекочущими нервы темами вроде секса или убийства. Это – тема отношений. Но следует уточнить: в данном случае речь идет не о страсти и романтической любви; не об отношениях между учителем и учениками, между работником и начальником. Это – тема близости, человеческой общности. В сценах, где разрабатывается эта тема, важнейший признак бестселлера, люди ощущают близость друг к другу, душевное тепло, духовное родство.

Даниэла Стил как автор любовных романов, конечно, делает упор на подобные сцены, но даже у Гришэма адвокатам-трудоголикам выпадают минуты человеческого тепла. В «Юристе» молодой адвокат решает на один вечер отложить работу, берет бутылку вина и обед навынос в китайском ресторане и идет к женщине, которая ему ближе всех. Это не судьбоносное объяснение в любви: они просто беседуют о том о сем и в конце концов засыпают на диване перед телевизором. В «Фирме» другой молодой адвокат поступает точно так же – берет навынос китайскую еду и (вероятно, такую же) бутылку красного вина. Кажется, ничего особенного, но действует без промаха. Персонажам нужны эти моменты непринужденной близости и тепла, даже если в них нет особой романтики. Это может быть поход по магазинам с мамой, или рыбалка с отцом, или совместное приготовление еды с новым возлюбленным, – у персонажей должно быть время друг для друга.


С определенной уверенностью можно предположить, что американские читатели на самом деле любят книги о самих себе. По-видимому, нам нравится видеть в романе свою собственную жизнь, но наполненную драматизмом. Сейчас мы рассмотрим тематические закономерности рынка, и вы сами решите, так ли это.

Темы, неэффективность которых бросается в глаза, – это все те, что относятся к фантастике и иным мирам. Выдуманные языки, диковинные твари, космические корабли, сражения в открытом космосе, пейзажи иных планет – статистика показывает, что на сегодняшнем рынке все это сильно проигрывает реализму. Но и среди реалистических тем одни ведут к успеху, а другие – к провалу. Среди хороших, популярных и (для писателей) выгодных тем – отношения супругов, смерть и налоги (как ни странно, это не шутка). Другие хорошие темы – технологии (лучше современные, непонятные и страшноватые), похороны, огнестрельное оружие, врачи, работа, школы, президенты, дети, матери, газеты и другие средства массовой информации. Среди провальных тем мы уже отметили секс, наркотики и рок-н-ролл. Сюда же можно добавить соблазнение, эротику, любые описания тела (кроме случаев, когда описание относится к болезни или сцене убийства – в этом случае оно способствует успеху у читателей). Лучше также сказать «нет» сигаретам, алкоголю, религии, отчаянным эмоциям вроде страстной любви и безграничного горя, революциям, финансовым махинациям, экзистенциальным философским отступлениям, званым ужинам, игре в карты, роскошно одетым женщинам и танцам (уж извините)[76]. Огнестрельное оружие и работа ФБР – лучше, чем веселье и легкомысленные непристойности. Читающая публика хочет видеть описания фондового рынка, а не человеческих лиц. Лаборатория лучше, чем церковь; духовность лучше, чем религия; учеба лучше вечеринок. И наконец, ответ на самый главный и животрепещущий вопрос: судя по всему, читатели безусловно предпочитают собак кошкам.

Что касается места действия, здесь читатели тоже четко знают, что им нравится, и предпочтений своих не меняют. Они хотят, чтобы действие книги происходило в городе (большом или маленьком), и соглашаются на самые разнообразные описания этого города. Главное, чтобы не пришлось чрезмерно напрягать воображение. Никаких иных планет («Марсианин» Энди Уэйра это правило нарушает, зато в нем, во-первых, масса увлекательных научно-технических подробностей, а во-вторых, в отличие от других «космических» книг, весь сюжет построен на том, чтобы благополучно вернуть героя домой). Пустыня не годится. Равным образом не годятся океан, джунгли и богатое ранчо. Ограничьтесь обычным человеческим жильем. Не стоит тянуть читателей туда, где вы сами не бывали, – а если вы путешествовали по совсем уж экзотическим краям, оставьте эти впечатления для своих мемуаров.

Действующими лицами мы займемся в 5-й главе. Но моделирование тематики уже дает нам кое-какие подсказки и в этой области. Ограничьтесь обычными людьми. Не надо гномов, лордов, воинов, жриц, йоменов, герцогов и особенно волшебников (и не надейтесь, что вам удастся написать второго «Гарри Поттера»).

И наконец – никаких единорогов.

Списки: тематика

Списки любят все. Эти «горячие десятки» составил для нас бестселлерометр. Вот список потенциальных бестселлеров, выбранных за тематику.

Десять лучших романов по тематике (за исключением Джона Гришэма и Даниэлы Стил)

1. «Последнее правило», Джоди Пиколт (House Rules, Jodi Picoult)

2. «Девятнадцать минут», Джоди Пиколт (Nineteen Minutes, Jodi Picoult)

3. «Острая дюжина», Джанет Иванович (Twelve Sharp, Janet Evanovich)

4. «Заказ», Дэвид Балдаччи (The Hit, David Baldacci)

5. «Снять сливки», Джанет Иванович (Plum Lovin’, Janet Evanovich)

6. «Сфера», Дэйв Эггерс (The Circle, Dave Eggers)

7. «Хрупкая душа», Джоди Пиколт (Handle with Care, Jodi Picoult)

8. «Восемнадцать – это бомба», Джанет Иванович (Explosive Eighteen, Janet Evanovich)

9. «Отъявленные девятнадцать», Джанет Иванович (Notorious Nineteen, Janet Evanovich)

10. «Особые отношения», Джоди Пиколт (Sing You Home, Jodi Picoult)

Десять романов с самым высоким содержанием темы человеческой близости (за исключением Джона Гришэма и Даниэлы Стил)

1. «Последняя любовь», Нора Робертс (The Last Boyfriend, Nora Roberts)

2. «Сплетенная с тобой», Сильвия Дэй (Entwined with You, Sylvia Day)

3. «Остановись, мгновенье», Нора Робертс (Vision in White, Nora Roberts)

4. «Отраженная в тебе», Сильвия Дэй (Reflected in You, Sylvia Day)

5. «Сердце красавицы», Нора Робертс (Happy Ever After, Nora Roberts)

6. «Шипы и лепестки», Нора Робертс (Bed of Roses, Nora Roberts)

7. «Отныне и навсегда», Нора Робертс (The Next Always, Nora Roberts)

8. «Обнаженная для тебя», Сильвия Дэй (Bared to You, Sylvia Day)

9. «Любить того, кто рядом», Эмили Гиффин (Love the One You’re With, Emily Giffin)

10. «Подсказка для спящей красавицы», Нора Робертс (The Hollow, Nora Roberts)

Вот еще несколько списков, забавы ради:

Десять лучших романов на тему книг и чтения

1. «Историк», Элизабет Костова (The Historian, Elizabeth Kostova)

2. «Люди книги», Джеральдин Брукс (People of the Book, Geraldine Brooks)

3. «Имя розы», Умберто Эко (Il nome della rosa, Umberto Eco)

4. «Клуб любителей книг и пирогов из картофельных очистков», Энн Шеффер (The Guernsey Literary and Potato Peel Pie Society, Mary Ann Shaffer)

5. «Чудо любви», Николас Спаркс (True Believer, Nicolas Sparks)

6. «Манускрипт всевластия», Дебора Харкнесс (A Discovery of Witches, Deborah Harkness)

7. «Рождественская шкатулка», Ричард Пол Эванс (The Christmas Box, Richard Paul Evans)

8. «Ведьмы» Элеанор Браун (The Weird Sisters, Eleanor Brown)

9. «Алхимик», Пауло Коэльо (O Alquimista, Paulo Coelho)

10. «Чтец», Бернхард Шлинк (Der Vorleser, Berhard Schlink)

Десять лучших книг о современных технологиях

1. «Пылающая комната», Майкл Коннелли (The Burning Room, Michael Connelly)

2. «Скарпетта», Патрисия Корнуэлл (Scarpetta, Patricia Cornwell)

3. «Сфера», Дэйв Эггерс (The Circle, Dave Eggers)

4. «Острая дюжина», Джанет Иванович (Twelve Sharp, Janet Evanovich)

5. «Мистер Мерседес», Стивен Кинг (Mr. Mercedes, Stephen King)

6. «Начертание», Тим Лахэй и Джерри Дженкинс (The Mark, Tim LaHaye, Jerry B. Jenkins)

7. «Двойной крест», Джеймс Паттерсон (Double Cross, James Patterson)

8. «Алекс Кросс, беги», Джеймс Паттерсон (Alex Cross, Run, James Patterson)

9. «Надейся умереть», Джеймс Паттерсон (Hope to Die, James Patterson)

10. «Куда ты пропала, Бернадетт?», Мария Сэмпл (Where’d You Go, Bernadette, Maria Semple)

Десять лучших книг с участием собак

1. «Жизнь и цель собаки», Брюс Кэмерон (A Dog’s Purpose, W. Bruce Cameron)

2. «Опасный след», Нора Робертс (The Search, Nora Roberts)

3. «Самый темный вечер в году», Дин Кунц (The Darkest Evening of the Year, Dean Koontz)

4. «Гонки на мокром асфальте», Гарт Стайн (The Art of Racing in the Rain, Garth Stein)

5. «Куджо», Стивен Кинг (Cujo, Stephen King)

6. «Счастливчик», Николас Спаркс (The Lucky One, Nicholas Sparks)

7. «Слезы дракона», Дин Кунц (Dragon Tears, Dean Koontz)

8. «Четыре после полуночи», Стивен Кинг (Four Past Midnight, Stephen King)

9. «История Эдгара Сотеля», Дэвид Вроблевски (The Story of Edgar Sawtelle, David Wroblewski)

10. «Выбор», Николас Спаркс (The Choice, Nicholas Sparks)

3. Хватай быка за рога, или Как добиться идеальных изгибов

«Простите за громкие слова, но в истории случаются моменты, изменяющие мир: изобретение колеса, двигателя внутреннего сгорания, антибиотиков, персонального компьютера» – это высказывание принадлежит писателю М. Кристиану. Есть один роман, появление которого также совершило революцию. Тот самый. «Без сомнения, – писал М. Кристиан, – эту книгу мы запомним за то, что она изменила всё». Ее прочли даже люди, которые годами не брали книг в руки. Писатели, работающие в том же жанре, вдруг поняли, что им есть куда стремиться. Издательства срочно набирали дополнительный штат редакторов, желая воспользоваться моментом и обогатиться. Это было нечто. Женщины всего мира обсуждали содержание романа в прессе, в личных блогах и, конечно, с мужьями. Шел 2011 год. За последующие четыре года той самой книге было суждено разойтись тиражом 125 миллионов экземпляров.

Она вызвала жаркие споры. Каждый рецензент, каждый писатель и вообще любой представитель книжного мира считал своим долгом заявить, что она ужасна. Автора обвиняли в неумении писать, плохом стиле, искаженном представлении основных тем, незрелости и неправдоподобии характеров героев, непонимании того, как должен строиться сюжет. Многие читатели изливали свое негодование на сайте goodreads: по их мнению, книга сильно навредила не только литературе, но и делу равноправия женщин. В рецензиях, оценивших ее на одну звезду из пяти, говорилось, что она «служит идеальной иллюстрацией к слову “ужасный”» и «так чудовищна, что я не могу промолчать». Но, несмотря на это, популярность книги разрасталась подобно эпидемии гриппа. Хозяйка книжного магазина в Нью-Джерси – как и другие книготорговцы, она распродала все имеющиеся у нее экземпляры – не знала, что и думать: «Наши покупатели – интеллигентные люди, и все они говорят, что книга написана просто ужасно, а сами уже читают третий том!» Она была совершенно права. Даже высоколобые книжные черви, обычно предпочитающие произведения лауреатов всевозможных премий и элегантную прозу, подсели на тот самый роман. Они ругали его – и в то же время просили еще.

Эта книга – «Пятьдесят оттенков серого». Литературный опиум для миллионов читателей и большая проблема для двух литературоведов, нашедших ее у себя на столе с приклеенной записочкой на желтом стикере: «А объясните-ка это!»

Поиски клада

Мы не помним, что именно сказали друг другу, когда «Пятьдесят оттенков» начали свое победоносное шествие. Возможно, один из нас воскликнул: «Ой-ой-ой!» – а другой отозвался: «О, черт!» Первыми результатами нашего труда – трехлетних исследований в Стэнфорде – как раз заинтересовались журналисты, и мы только что дали интервью, в котором заявили, что книги, полные описаний секса, никогда не попадут в список NYT. И тут появляется роман, в котором секс фигурирует практически на каждой странице, и не просто секс, а «с вывертами» – в ход идут хлысты, наручники и многохвостые плетки, и его расхватывают, как горячие пирожки.

Каждый – даже тот, кто не читал «Пятьдесят оттенков», – считал своим долгом как-то отреагировать. Для нас же (во всяком случае, как исследователей) все это означало, что надо бы заново проверить компьютерную модель и в частности утверждение насчет темы секса в бестселлерах. Мы стремились с помощью алгоритмов глубже постичь силы, движущие читателями, и эта книга стала для нас вызовом. Могли бы мы предсказать ее успех или это аномалия?

Как вы уже знаете, каждый текст, попадающий на анализ бестселлерометру, получает индекс – показатель вероятности попадания в бестселлеры. Тогда, в 2011 году, мы занимались компьютерным анализом только темы и стиля. Наши стандарты были весьма высоки: другой, возможно, удовлетворился бы предсказанной вероятностью успеха 70 % и опубликовал такую книгу, стараясь добрать недостающее с помощью рекламы и маркетинга. Но нам нужна была вероятность успеха не менее 95 %.

Мы скормили компьютеру «Пятьдесят оттенков серого», опасаясь, что сейчас вся наша система полетит в тартарары. Как оценит машина бестселлер-аномалию про Ану, Кристиана и их забавы в специально оборудованной комнате для БДСМ? Но компьютер не растерялся. Ему было что сказать по этому поводу.

Наша первоначальная модель, основанная на анализе темы и стиля (до стиля мы доберемся в следующей главе), дала произведению Э. Л. Джеймс оценку 90 %. Судя по этому показателю, в книге было кое-что и помимо «секса с вывертами». Поскольку мы обучали модель на корпусе текстов, в котором были также и эротические романы, не попавшие в список бестселлеров NYT, она вполне логично ассоциировала темы нетрадиционного секса и БДСМ с низкой вероятностью успеха. На основании большого объема данных модель пришла к выводу, что откровенные описания секса мешают попасть в список бестселлеров. Наша модель – не хрустальный шар, она не предсказывает появление новых модных тем на книжном рынке. Однако в этой книге она что-то разглядела.

Может быть, несмотря на фурор, нетрадиционный секс – не главная причина успеха «Пятидесяти оттенков»? Если популярность романа в самом деле обусловлена спросом на «порнушку для мамочек» (как «Оттенки» окрестили в СМИ), значит, наш алгоритм кардинально ошибочен. Но вместо этого мы увидели следующую картину: стиль Э. Л. Джеймс действительно не понравился компьютеру (оценка составила всего 50 %), а вот тематический профиль ее книги был именно такой, как надо. Но разве это возможно?

В предшествующих главах мы объяснили, что у самых популярных романов есть две-три главные темы, занимающие до трети объема, и что писатели (особенно те, кто год за годом штампует похожие книги) добавляют небольшое количество других тем, чтобы придать разнообразие и подстегнуть интерес читателей. Мы также сказали, что бестселлеры отличаются от небестселлеров, в частности, наличием определенных тем – например «технологии XXI века». Основная тема, использование которой отличает успешные книги от неуспешных, – тема человеческой близости. Такая близость может существовать в любых отношениях. Оказывается, именно эта тема (а не откровенные сцены в «красной комнате боли») составляет 21 % объема «Пятидесяти оттенков серого». Следовательно, Э. Л. Джеймс пишет совсем не так, как другие авторы в категории «эротика».

Оказалось, что вторая главная тема в «Оттенках» – тоже не БДСМ! Это нечто неотъемлемое от человеческой близости – откровенные, задушевные разговоры. Они составляют 13 % романа. Это насыщенные сильными чувствами беседы героини – не только с Кристианом, но и с лучшей подругой Кейт, с лучшим другом Хосе, с матерью и отчимом. Третья самая важная тема в романе Джеймс, занимающая примерно 10 % «тематической ДНК», – невербальные коммуникации: взгляды, улыбки, выражение лица.

Таким образом, тщательное исследование с помощью компьютера показало, что ни одна из трех главных тем книги не имеет отношения к нетрадиционному сексу. Конечно, в тематическом профиле романа секс есть: четвертая, пятая и шестая (по количеству занимаемого объема текста) темы именно к нему и относятся. Вместе они составляют примерно 13 % романа. Это соблазнение, собственно секс и женское тело. Однако ясно: роман на самом деле глубже и интереснее, чем кажется по рецензиям, авторы которых зациклились на теме БДСМ. Мы это поняли и осознали неправоту критиков, утверждающих: «“Оттенки” – пример того, как НЕ надо писать!» Судя по всему, Э. Л. Джеймс уловила кое-какие важные тенденции современной беллетристики. В отношении тематического профиля она многое сделала правильно, то есть в соответствии с запросами рынка. Две темы отвечают за 30 % объема романа? Ставим галочку. Вместе с третьей темой получается 40 % объема? Ставим галочку. Одна из них – тема человеческой близости? Ставим галочку. Сознательно или бессознательно эти приемы использовали многие авторы бестселлеров NYT в самых разных жанрах. Но мы поняли, что у Э. Л. Джеймс можно еще и кое-чему поучиться.

Уже по тематическому профилю стало ясно, что нельзя объяснять успех «Оттенков» исключительно удачей, случайным попаданием при выстреле наугад. Кроме того, тематический профиль заставил нас серьезно приглядеться к роману. Джеймс в это время поливали грязью во всех СМИ и в интернете: мол, и книга ее – полный мусор, и славы она не заслуживает, и писать нигде не училась, и вообще «Оттенки» – аномалия, нечто вроде мутанта. И все же, сказали мы себе, нельзя случайно заработать десятки (а тем более сотни) миллионов долларов. Чтобы покорить весь мир, нужно действовать целенаправленно. В любой другой индустрии такая мысль была бы смехотворной. Но мы смотрели, как Э. Л. Джеймс совершает переворот в книжном деле, заново приучая к чтению миллионы людей, и думали: а вдруг она знает, что делает? Вдруг феноменальный успех ее книги – вовсе не аномалия, не позор книжной индустрии? Прочитав книгу, мы поняли, что она не черный лебедь. Нужно просто разгадать скрытые в ней тайны.

Тематический профиль романа дал нам ключ к разгадке, первый намек. Скорее всего, уверенность критиков в том, что успех «Оттенков» объясняется «сексом с вывертами», ошибочна. Эта книга – не столько эротическая литература, сколько любовный роман «с перчиком», основная линия которого – эмоциональная связь между героем и героиней. Описания секса в нем весьма смелы, и это дало прессе материал для хлестких заголовков, но он так увлекает и дразнит читателя в первую очередь не эротическими сценами, а постоянно возникающим вопросом – подчинится Ана или нет – и страстными спорами любовников.

Небольшая проблема тематического профиля «Оттенков» состоит в том, что три главные темы книги не задают никакого особенного конфликта. Даже не читая рукопись, можно сказать, что родственные темы, как правило, не дают автору места для создания интересного столкновения, движущего сюжет. Легко заметить, что Даниэла Стил использует темы «человеческая близость» и «больницы», чтобы зацепить и не отпускать читателя. Но у Э. Л. Джеймс главная тема – «человеческая близость», а вторая – «задушевные беседы». Это практически одно и то же.

Двигатель романа – конфликт; глядя на темы, составляющие 30 % «Оттенков», мы поневоле гадаем, как же автор на их основе создаст увлекательный сюжет и притягательные характеры персонажей. Казалось бы, близость и задушевные беседы в качестве главных тем сулят немедленную счастливую развязку, а не триста страниц треволнений. Но не тут-то было! Джеймс об этом позаботилась, выписывая характер Кристиана. Для него близость и задушевность – источники бесконечного конфликта и постоянной внутренней борьбы. Джеймс рисует мрачного байронического красавца – типаж, популярный еще со времен Харди и сестер Бронте. Одной этой мятущейся мужской души, пожалуй, хватило бы для приличной завязки – но в романе есть что-то еще, заставляющее миллионы читателей торопливо переворачивать страницы. Тематический состав «Пятидесяти оттенков серого» объясняет в успехе книги многое, но мы чувствовали: есть еще какое-то доказательство того, что Э. Л. Джеймс по праву заняла место на литературном Олимпе.

На сайте goodreads.com почти 509 тысяч человек поставили «Оттенкам» пять звезд, и во всех пятизвездочных рецензиях есть нечто общее. Пенни Энн Лаптон наставляет будущих читателей и поклонников романа:


1. Приготовьте носовой платок, потому что при чтении вы непременно разрыдаетесь от наплыва чувств.

2. Обязательно выделите побольше времени на чтение, потому что, раз взяв книгу в руки, вы уже не сможете ее отложить.

3. ВАЖНО! Заранее приготовьте холодное питье, лед, холодные мокрые полотенца или охлаждающее оборудование, такое как кондиционеры и вентиляторы.


Другая читательница, Клэр, обращается непосредственно к герою книги, Кристиану:

Дорогой сэр. Каждую минуту бодрствования я думаю о вас. Вы даже снились мне. Я уже физически не могу существовать без этой книги и каждую свободную минуту хватаюсь за нее, чтобы почитать о вас. Я даже поесть не успеваю – ведь на это время мне придется расстаться с вами.

Читательница Джулиана пишет:

Я испытывала невероятный душевный подъем, читая эту потрясающе прекрасную книгу – к тому же в ней оказались неожиданно смешные сцены с хорошим чувством юмора. Во время чтения меня охватывала приятная дрожь предвкушения, но в то же время пронизывал страх.

Эти страстные послания дают материал для важной догадки. Описывая свои чувства при чтении, поклонницы Джеймс постоянно говорят о теле и телесных реакциях. П. Э. Лаптон упоминает слезы и жар. Клэр сообщает, что пренебрегает едой и сном. Джулиана говорит, что ее пронизывали приятная дрожь и страх – телесные ощущения. Поняв, что хотели сказать нам посетители goodreads, мы прочитали книгу заново, обращая внимание уже на другие аспекты. И тут нас осенило. Мы сформулировали свою гипотезу по поводу творения Джеймс: тема человеческой близости – фундамент «Пятидесяти оттенков», но она вовсе не тождественна небоскребу, который писательница на ней построила.

Код тела

На уроках литературы в старших классах, как правило, учат подходить к тексту критически. Нас всех учили читать между строк, анализировать текст и выделять в нем смысл. Мы должны были писать сочинения. Оказывается, многие из тех, для кого написание сочинений стало профессией, продолжают подходить к своей задаче точно так же. Преподаватели английского и литературные обозреватели, как правило, интерпретируют текст и судят о нем на основании рационального подхода. Возьмем типичные претензии критиков к «Пятидесяти оттенкам серого». И критики, и писатели-профессионалы в области эротической литературы жалуются на нестыковки в романе. Как это Анастасия[77] получила степень бакалавра литературы, не имея собственного ноутбука? Насколько вероятно, что она испытала множественные оргазмы во время первого в жизни секса? Кристиану еще нет тридцати – когда же он успел сколотить свои миллионы (что, согласно книге, сделал самостоятельно) и насколько правдоподобно, что при этом он ослепительный красавец? Реально ли ежедневно ездить на работу из Портленда в Сиэтл и обратно? Предположительно подобные нелепости оскорбляют здравый смысл читателей, и успех книги кажется абсолютно невозможным.

Другие рецензенты разозлились на успех «Оттенков», проведя собственный анализ предположительного смысла книги. Оказывается, Кристиан и Ана не являются достоверными представителями БДСМ-сообщества. История Кристиана основана на чрезмерно упрощенном, дилетантском толковании вопросов психологической травмы, сексуальных предпочтений и исцеления. Кроме того, существует мнение, что поскольку Э. Л. Джеймс описала готовность Аны подчиниться в садомазохистских отношениях, это значит, что Э. Л. Джеймс – антифеминистка.

Все эти утверждения, во-первых, показывают, что их авторы не видят разницы между беллетристикой и документальными очерками. Во-вторых, они базируются на уверенности в том, что читаем мы прежде всего разумом и что читатели ищут в книге ответ на вопрос «Что хотел сказать автор?» и стараются вынести из нее некий легко формулируемый «урок».

Этот подход, вероятно, не самый удачный для объяснения успеха романа. Излишне говорить, что «Оттенки» в первую очередь не «пища для ума». Этот роман сильнее, чем многие другие, требует, чтобы мы задались вопросом: «Зачем люди читают художественную литературу?» – и были честны, отвечая на него. Успех «Оттенков», если мы не хотим просто отмахнуться от него, заставляет нас задуматься: что делает книгу хорошей? Кто имеет право сказать, что она хороша? И на основании каких критериев? Мы полагаем, что ответы на эти вопросы помогут развеять недоумение хозяйки книжного магазина в Нью-Джерси, чьи клиенты ругали книгу и при этом продолжали ее читать. Понятно, что внимание Пулитцеровского комитета «Оттенки» никогда не привлекут, но все же невозможно пренебречь аудиторией 125 миллионов человек. То, что они прочли книгу, показывает: хотим мы того или нет, но она воздействует на читателя, причем не так, как большинство других романов.

Восторженные отзывы на «Пятьдесят оттенков» наводят на мысль, что следовало бы серьезно рассмотреть эмоциональные и телесные реакции читателей, которые твердят, что эта книга вызвала у них отклик – «всколыхнула нутро», заставила вибрировать в резонансе. Они настаивают на том, что удовольствие от чтения не обязано быть интеллектуальным; оно может быть наслаждением для сердца, чувств, тела и – для тех, кто верит в такие вещи, – души. Беда в том, что этот подход к литературе очень долго клеймили как постыдный и недостойный. Одна женщина – литературный агент – описала свои ощущения от «Пятидесяти оттенков» с помощью очень удачной аналогии: «Я точно так же ерзаю от стыда, кладя себе лишний шарик мороженого или контрабандой жуя шоколад, когда я на диете, – ведь если наслаждение так велико, столь же велико должно быть и прегрешение»[78]. Греховные удовольствия!

Этот принцип – «что приятно читать, то читать постыдно» – на самом деле отнюдь не нов. С 1774 по 1820 год в США было опубликовано всего лишь девяносто наименований художественной литературы, но уже к 1840 году число опубликованных книг выросло до 800. Предложение росло, чтобы удовлетворить спрос – особенно со стороны женщин, которые читали романы запоем и требовали еще. Люди, имеющие доступ к выражению своего мнения в печати, тут же объявили, что удовольствие от подобного чтения – недостойное. В 1855-м главным бестселлером года стала книга некой Марии Сюзанны Камминз «Фонарщик»[79]. Она разошлась огромным для своего времени тиражом – 70 тысяч экземпляров в первый же год в США и еще 100 тысяч – в Британии. Популярность «Фонарщика» у читателей не убывала в течение многих десятилетий. Один критик назвал эту книгу «чрезвычайно оригинальным и естественным повествованием», но Натаниель Готорн, сам известный писатель и критик (чье мнение ценится и по сей день), невзлюбил ее. «В чем загадка бесчисленных переизданий “Фонарщика”?» – спрашивал он у своего редактора. Готорну, как и многим литературным критикам (тогдашним и современным), бестселлер как явление казался необъяснимым. Готорн заявил своему редактору, что для него невыносимо быть коллегой «толпы баб, марающих бумагу» и производящих «мусор», которым зачитывается Америка; Готорн сказал, что лучше вовсе перестанет писать. Подобные воззрения живы до сих пор.

Роман «Фонарщик» повествует о судьбе никем не любимой девочки-сироты по имени Герти. Она живет у злой старухи, но потом ее оттуда забирают и воспитывают в ней способность любить, крепкие моральные ценности и веру. В то же время девочка сохраняет природную живость и твердость характера. Конечно, к концу книги она взрослеет и наконец находит свою любовь. Роман пользовался огромной популярностью; Готорн же считал его чересчур сентиментальным.

Через сто лет другой писатель, Джеймс Джойс, вывел в романе «Улисс»[80] героиню по имени Герти Макдауэлл. Джойсова Герти – безжалостная карикатура на героиню «Фонарщика». У нее есть изъян – хромая нога; кроме того, она полна греховных мыслей и больше всего на свете интересуется собственными трусами. Несмотря на огромный успех «Фонарщика», ни Готорн, ни Джойс и не думали принимать всерьез сироту Герти. Оба писателя-мэтра презирали «Фонарщика» за то, что его автор старалась играть на чувствах читателя, и считали такой подход позорным.

Прошло сто пятьдесят лет, но сообщество литературных критиков по-прежнему состоит из Готорнов и Джойсов. Как и эти писатели, критики предпочитают видеть в художественной литературе скорее пространство для социально-политического анализа или осознанных языковых экспериментов, чем место для получения удовольствия. Рекомендуя литературу своего времени, Готорн составил список из десяти книг, выбранных за лучшие описания Америки, за историчность или рассуждения о политике, за искусные поэтические метафоры или изящное построение фраз. Но другие литературоведы более взвешенно отнеслись к «Фонарщику» и прочим современным им романам женского авторства. Некоторые – в весьма изящных формулировках – оценили мощь художественного повествования, которое разворачивается в мире чувств, а не в мире истории и политики. Эти литературоведы – кстати, по большей части женщины – всерьез восприняли «книги, в которые уходишь с головой», «удовольствие бегства от действительности», «очарование вымысла»[81]. Они признали: некоторые романы так сильно «воздействуют на массы» не из-за того, что они «говорят» читателю, а из-за того, что они с ним делают. Не следует считать подобное чтение второсортным.

Дженис Рэдуэй, литературовед, потратила много лет на исследование вопроса, почему люди читают популярные книги. Она прекрасно описывает собственный опыт чтения художественной литературы:

В моей жизни бывают моменты, когда книга становится чем-то большим, нежели просто предмет; когда она переносит меня в другое место, в состояние транса, которое трудно описать. В этих случаях чтение, или то, что Марсель Пруст назвал «плодотворным чудом общения, происходящего в одиночестве», преодолевает мой рациональный подход ученого критика к книгам как человеческим творениям. Когда это происходит, книга, текст и даже сам процесс чтения исчезают, и происходит некое странное пресуществление, в котором мое «я» становится иным и претворяется в мысли, отличные от тех, что обычно производит мое сознание. Это тактильное, чувственное, глубоко эмоциональное ощущение, когда тебя захватывает книга, – вот что будят у меня в душе воспоминания о чтении, подобно мадленкам у Пруста. Это ощущение – абсолютно осязаемое, телесное, хотя вызвано не физическими стимулами[82].

Работая над «Кодом бестселлера», мы попросили своих студентов провести эксперимент-наблюдение (практически медитацию) и зафиксировать все реакции, возникающие у них при чтении незнакомой книги. Конечно, мозг в это время размышляет и анализирует, но что делают чувства? Более того, какова физическая реакция тела на печатное слово? Мы спрашивали студентов: «Когда у вас учащается пульс?», «Когда у вас сосет под ложечкой от беспокойства?», «Когда вы сжимаетесь от страха или ощущаете сексуальное возбуждение?», «Когда у вас встают волосы дыбом?», «Когда вы улыбаетесь?», «Когда вы возмущенно кричите на персонажа или швыряете книжку об стену?».

Это совсем новый способ чтения, и он заслуживает внимания. Мы раздали студентам несколько романов и попросили читать про себя и поднять руку, если возникла какая-либо реакция тела. Сначала студенты решили, что мы сошли с ума. Но после нескольких занятий мы заметили, что у всех, кому мы раздали бестселлеры из списка NYT, рука поднимается не позднее первых десяти страниц. С теми же, кому достались небестселлеры, такое случалось гораздо реже.

Захватывающее, живое, дышащее повествование – эти эпитеты в полной мере относятся к «Пятидесяти оттенкам серого». Лишь осознав, насколько умело Э. Л. Джеймс использует аффективный отклик, в полной мере объясняющий признания читательниц: «Я просто подсела на эти книги!», мы поняли, что именно происходит в романе, и решили, что обязательно должны об этом написать.

Джеймс вплетает в повествование эмоциональные повороты с такой регулярностью, что читатель ощущает биение слов всем телом, словно вибрацию музыки в ночном клубе. Лишь двадцать пять других романов-бестселлеров воплощают тот же ритм, что и книги Джеймс, и нам удалось найти лишь один, в котором ощущается такое же размеренное биение. По странной случайности этот роман оказался другим бестселлером для взрослых с рекордными за последние тридцать лет тиражами. Это единственный роман в нашем корпусе текстов, который не только с самого начала вызвал такую же бурю противоречивых откликов у читателей, но и (на сегодняшний день) превзошел по тиражам «Пятьдесят оттенков серого». Речь идет о книге Дэна Брауна «Код да Винчи».

Идеальные изгибы

Посмотрите на графики, приведенные на рис. 4. Эти кривые показывают, как три разных автора, работающих в жанре эротического романа, манипулируют эмоциональной реакцией героев (а значит, и читателей) на протяжении всей книги. Графики интуитивно понятны, так что их легко интерпретировать. Горизонтальная ось координат в середине – это эмоционально нейтральная область. Примерно такой «наплыв чувств» ощущаешь, варя себе кофе. Над горизонтальной осью координат располагаются сцены, в которых герои испытывают положительные переживания – удовольствие от флирта, облегчение, радость, возбуждение, ликование, любовь. В общем, любые чувства, от которых человеку хорошо. Чем выше поднимается кривая, тем насыщенней чувства персонажа. Под горизонтальной осью отражены ситуации не столь положительные – в любовных романах «провалы» графика соответствуют, например, моментам, когда судьба разлучает влюбленных, происходит конфликт, виной которому несходство характеров или внешние обстоятельства, угрожающие счастью пары.


Рис. 4. Три сюжета


Эти три книги – эротические романы, изначально опубликованные самими авторами. Даже не зная, какому сюжету соответствует тот или иной график, можно догадаться, который из них завоевал мировой книжный рынок. Сразу становится ясно, в чем разница между романом с задатками бестселлера и заурядной книгой. Во всех трех затрагиваются примерно одни и те же темы – миллиардеры, любовь, секс, психологические проблемы, – но не один лишь тематический состав приносит мировую славу. «Зависима от тебя»[83] тяжелее в эмоциональном плане – оба главных персонажа страдают от болезненных пристрастий и обоим, прежде чем подняться, суждено скатиться на самое дно. Эмоциональный график этой книги располагается по большей части ниже нулевой отметки. «Играя в игры»[84] явно полегче.

Точки графиков, где рост сменяется падением, примерно соответствуют моментам конфликта и их разрешения в сюжете. Чем чаще взлеты и провалы, тем сильнее раскачиваются «эмоциональные качели» читателя. Вторая производная в точках экстремума показывает, насколько интенсивна динамика эмоций. В отзывах читателей и рецензиях критиков все эти термины трансформируются в выражения вроде «не оторвешься», «захватывающий сюжет», «саспенс».

У нас есть друг, чей агент никак не мог продать его последнюю книгу: семь редакторов в разных крупных издательствах сказали, что она им в самом деле понравилась, но чего-то в ней не хватает. Из-за отсутствия этого «чего-то» они отказались издавать ее. Это нечто неопределимое, je ne sais quoi, его можно назвать обаянием, харизмой. Бывают такие люди – стоит им войти в комнату, и все разговоры прекращаются, все взгляды обращаются на них. Компьютерный анализ позволил нам чуть точнее определить природу этого обаяния.

Мы проанализировали роман нашего друга с помощью своей компьютерной модели, показали ему кривую эмоций, и он тут же многое понял. На графике было видно, что автор еще не овладел одним из главных для писателя правил – Джон Гришэм утверждает, что это правило обязательно и незаменимо. Вот оно: читателя следует сажать на крючок не позднее сороковой страницы. Впрочем, большинство редакторов-рецензентов скажет, что сорок – слишком много. Эти сорок страниц – ваша единственная возможность зацепить читателя.

При этом разница между слабой эмоциональной зацепкой (тихое хихиканье или улыбка про себя) и такой, что хватает читателя за шкирку и не отпускает, видна невооруженным взглядом. Это – острота первого пика или первого провала графика. Это крючок, на который вы ловите читателя. Если он отсутствует – вашу книгу отложат после первой или второй главы. Уж извините. Обратное тоже верно: если книга давно лежит у вас на тумбочке возле кровати и вы все собираетесь ее прочитать, но никак не можете осилить больше двух абзацев за раз – скорее всего, изгибы ее эмоционального графика совершенно не годятся для литературного блокбастера.

У графика книги нашего друга тоже были пики и провалы. Они есть и у двух эротических романов, чьи кривые мы привели выше вместе с кривой «Оттенков серого». Но у нашего друга первый пик был скорее похож на кочку. Эмоциональная завязка присутствовала, и потому его рукопись согласились рассматривать семь редакторов, но она не цепляла читателя стальным крючком, а лишь подманивала едва слышным шепотом. Друг переписал завязку, придав ей значительно больше эмоций и драматизма. Он поднял ставки персонажей, обострил конфликт. Изгибы графика стали размашистей и равномерней. И издатели клюнули.

Давайте посмотрим еще раз на манящие изгибы графика «Оттенков». Они почти симметричны, задают идеальный ритм, их частота и амплитуда поддерживают напряженность конфликта, так что читатели все время сидят как на иголках. На рис. 5 показан график с размеченными на нем основными сценами романа.

Серая зигзагообразная линия, неровная и размашистая, отражает учащенное сердцебиение романа. Те, кто прочел «Пятьдесят оттенков» десять и более раз (а мы знаем, что таких людей много), скорее всего, узнают малейший эмоциональный перепад. Резкие скачки вверх-вниз отражают радости и горести Аны по мере того, как она и Кристиан то соглашаются друг с другом, то спорят (а это происходит каждые несколько страниц). Эти постоянные конфликты и их разрешения на микроуровне показывают, что происходит в отношениях между влюбленными. Это главный «крючок» книги, цепляющий читателя. А разве отношения могут развиваться по прямой – ни вверх, ни вниз?


Рис. 5. Основные сцены в «Пятидесяти оттенках серого»


Однако благодаря компьютерному моделированию мы можем сгладить кривую, чтобы подчеркнуть более низкую частоту смены эмоций. Черная линия отражает сюжет и до определенной степени показывает, с какой скоростью он развивается. Если вы никогда не читали «Пятьдесят оттенков», то, прочитав названия помеченных на графике сцен и увидев соответствующие им взлеты и провалы кривой, уловите все содержание книги за минуту. Движение вниз, первый провал, начинается, когда Ану посылают брать интервью у Кристиана и она обнаруживает, что один из вопросов, который она должна задать, – не гей ли он? Между Аной и Кристианом к этому времени уже проскочила искорка, Ане понятно, что Кристиан, скорее всего, не гей (их взаимный интерес уже ощутим!), и ей страшно неудобно озвучивать этот вопрос («Он резко вздыхает, и я в ужасе съеживаюсь»). Однако через несколько страниц ей удается свалять еще большего дурака. Посмотрите на нижнюю точку самого первого провала графика. В этой сцене Ана, которая не умеет пить, напивается в баре, и алкоголь придает ей храбрости. Она набирает телефонный номер – многие из нас в своей жизни совершали подобные звонки и потом об этом жалели. Когда Ана бросает трубку и Кристиан приходит за ней в бар, она замечает, до чего он красив, и ее тут же выворачивает под куст азалии.

Какой позор.

Пик графика с отметкой «Ванильный секс» соответствует сцене, в которой Ана сознается в своей девственности, выражает желание ее потерять, отдается Кристиану и на протяжении нескольких страниц испытывает множество упоительных оргазмов. Так и идет дальше – вверх-вниз, – пока сюжет не достигает высочайшей точки перед самым концом. В эпизоде с планером, когда Кристиан неожиданно дарит Ане потрясающий день в небе, оба испытывают наивысшую радость и свободу. Это один из редких моментов, когда Кристиан не мрачен, а Ана не анализирует каждый шаг.

Обычно подобный подъем знаменует приближение хеппи-энда, как положено в любовном романе. Но все, кто читал «Пятьдесят оттенков», знают, что Э. Л. Джеймс в последнюю минуту нарушает неявный договор с читателем: вместо того чтобы пожениться, влюбленные расстаются. Какое коварство со стороны автора! Посмотрите, как часты и круты повороты графика, – глядя на него, можно почувствовать, как рвутся сердца у обоих влюбленных, когда Ана заставляет Кристиана слишком далеко зайти в «комнате для игр», тут же сожалеет об этом и бежит от него навсегда. Этот финал разбивает сердца им обоим, а также всем читателям, которых эмоционально захватила их история. Мы хотим другой, счастливый конец!

Неудивительно, что вторая книга трилогии продавалась так хорошо.

Если еще немного сгладить график «Пятидесяти оттенков», можно увидеть и другие свидетельства того, что автор сознательно выстраивает сюжет. Преподаватели любого нарративного искусства – прозы, киносценариев, драмы – рассказывают ученикам о трехчастной структуре. Она известна со времен древних греков. Три части повествования иногда называют завязкой, конфронтацией и разрешением конфликта, или, по-другому, завязкой, кульминацией и развязкой. Писатель, усвоивший эту базовую структуру, ощутит необходимость в повороте сюжета примерно после первой трети книги, а потом – после второй трети. Увеличив масштаб до этого уровня, можно увидеть более сглаженную структуру «Пятидесяти оттенков», но основной ход сюжета все равно ясен. Причем на этом макроуровне становится понятно: роман не столько про БДСМ, сколько про то, как меняется отношение Аны к этому явлению. См. рис. 6.


Рис. 6. «Пятьдесят оттенков серого» в трех актах


Построив графики для всех книг из нашего корпуса текстов на одной шкале, мы поняли, что по форме графика романы можно разделить на семь основных групп. В пределах группы возможны небольшие вариации – например, у одного романа первый пик может быть более резким, чем у другого, или позитивная концовка четче выражена. Но тем не менее книги одной группы следуют примерно одной и той же траектории, и все романы из нашего корпуса текстов можно отнести к одной из семи групп.

Различные виды сюжетов показаны на рис. 7–13. Проще всего их понять, если рассматривать с точки зрения трехчастной структуры, срединной точки и разницы между началом и концом. Обратите внимание на то, что происходит на отметках, соответствующих примерно первой трети, середине и двум третям объема книги. Именно в эти моменты повествования в судьбе главного героя происходит перелом. Также обратите внимание на то, как кончается роман – хорошо или плохо для героя.

График сюжета первого вида (рис. 7) соответствует истории о постепенном переходе от несчастья к счастью. Для подобной книги в первую очередь характерно то, что в конце герои счастливее, чем в начале, – они испытывают трудности, которые потом разрешаются; в некоторых сценах (как раз когда начинает казаться, что жизнь повернулась к лучшему) происходит что-то угрожающее их счастью. В нашем корпусе текстов нашлись бестселлеры из всех семи сюжетных групп, так что нельзя однозначно рекомендовать конкретную группу как рецепт успеха. К романам первой модели относятся «Клиент»[85] Джона Гришэма, «Дочь хранителя тайны»[86] Ким Эдвардс, «Меня зовут Алекс Кросс»[87] Джеймса Паттерсона, «Крест Морриган»[88] Норы Робертс, а также «Обретение крыльев»[89] и «Тайная жизнь пчел»[90] Сью Монк Кидд.


Рис. 7. Сюжет первого вида


Рис. 8. Сюжет второго вида


Сюжет второго вида (рис. 8) на графике выглядит как инвертированный сюжет первого вида. Примеры романов этой модели: «Дьявол носит Prada» Лорен Вайсбергер, «Отъявленные девятнадцать» Джанет Иванович, «Костры амбиций» Тома Вулфа, «Радуга шесть»[91] Тома Клэнси и «Весь невидимый нам свет» Энтони Дорра. В сюжетах этого вида возможны вариации – график может быть сглаженным или более размашистым. Иногда временный подъем примерно в середине выражен ярче: это означает, что герои питают сильную надежду на поворот к лучшему. Но в любом случае сюжет этого вида повествует о герое, живущем в тяжелых обстоятельствах и, возможно, совершающем ошибки. К самому концу график может чуть-чуть приподниматься – обратите внимание, что на последних 20 % книги линия сюжета идет ровно, а не опускается все ниже и ниже, погружая героя в пучину трагедии. Возможно, последняя часть романа описывает, как герой наконец смирился со своим печальным положением.

Разумеется, мы не первые среди литературных критиков предположили, что число возможных сюжетов конечно. Хотя, скорее всего, Мэттью был первым, кто смог подтвердить это на материале компьютерной модели[92]. В 1959 году Уильям Фостер-Харрис заявил, что существуют всего три сюжета: с хорошим концом, с плохим концом и литературный сюжет. В 1993 году Рональд Тобиас предположил, что их двадцать. Другие литературоведы утверждали, что существует всего один универсальный сюжет или что их целых тридцать шесть. Самая известная теория принадлежит Кристоферу Букеру, который заявил, что сюжетов семь. Букер потратил несколько десятков лет и прочитал тысячи книг, чтобы доказать свою гипотезу.

Изучая виды сюжета, выданные компьютером, и работы Букера, мы обнаружили чрезвычайно интересные пересечения. Букер – приверженец юнгианской психологии, он не использует графическое представление сюжетов. Наша программа строит график на основании валентностей слов с положительным и отрицательным значением. Но тем не менее мы считаем, что найденные нами закономерности в общих чертах согласуются с теорией Букера и что описанные им семь сюжетов примерно соответствуют обнаруженным нами семи видам.

Сюжеты первого и второго вида, возможно, ближе всего к тому, что Букер называл комедией и трагедией. «Комедия» у литературоведов означает не столько забавный сюжет, сколько такой, в котором герой или герои постепенно преодолевают проблемы (иногда абсурдные или немыслимо сложные) и приходят к счастливому концу. Этот вид сюжета можно назвать «от смятения к просветлению». В нем часто фигурирует взаимное непонимание, расставания и прочие превратности, в результате которых герои находят свое счастье через триста страниц (а не через тридцать). Эта теория вроде бы соответствует нашему первому виду сюжета, а наш второй вид похож на то, что Букер и другие называют трагедией. Опять-таки «трагедия» не значит, что персонажи страшно мучаются на протяжении всей книги. «Дьявол носит Prada» – безусловно, не «Гамлет». Но Андреа, главная героиня, получает несколько суровых уроков – часто потому, что не прислушивается к собственному сердцу и интуиции, а также к советам близких людей. Гордыня (или высокомерие) – порок, характерный для героев трагедии, неизменно заводящий их в эмоциональную трясину. Этот сюжет часто основан на внутренних конфликтах и недостатках главного героя и показывает, как сам герой становится в первую очередь их жертвой и лишь во вторую – жертвой другого персонажа, «злодея», или сложных жизненных обстоятельств. У романов этой группы часто бывает плохой конец: возможно, герой осознает свои заблуждения, но слишком поздно. Например, Андреа теряет возлюбленного и едва не рвет отношения с семьей – из-за своей деспотичной начальницы и работы в модном журнале. К тому времени, когда она наконец понимает свою ошибку и увольняется, ей остается лишь вернуться в квартиру к родителям и снова искать работу в журналах – уже по другой тематике.


Рис. 9. Сюжет третьего вида


Сюжет третьего вида (рис. 9) – это история о взрослении или об очередной Золушке[93]. К этому виду относится, например, роман «Джейн Эйр». Но это не значит, что главный герой или героиня такого сюжета обязательно молоды. Правильнее будет сказать, что в этом сюжете всегда присутствует некоторое движение от кризиса к успеху.

Важный элемент такого сюжета – то, что сначала главного героя ждет счастливый поворот судьбы (например, Золушка встречает принца на балу), потом герой или героиня теряет все (часы бьют полночь), а затем поднимается из пучины отчаяния к исполнению желаний или к иному моральному удовлетворению. Речь идет не обязательно о любви: в этой группе есть романы всех жанров. К ней относятся, в частности, следующие бестселлеры: «Роковая связь»[94] Аниты Шрив, «Жена кухонного бога»[95] Эми Тан, «Мизери»[96] Стивена Кинга, «Заговор “Аквитания”»[97] Роберта Ладлэма и «Большая маленькая ложь»[98] Лианы Мориарти.


Рис. 10. Сюжет четвертого вида


График четвертого вида сюжетов (рис. 10) – это инвертированный предыдущий (именно к этому виду относится роман «Пятьдесят оттенков серого»). Видимо, это его Букер называл «Возрождением»: для него этот сюжет повествует о том, как главные герои изменяются, обновляются и в некотором смысле преображаются. Часто герой подвергается значительному влиянию со стороны, обычно «темному», развращающему. Поэтому в первом акте мы видим эмоциональный спад: моральные устои персонажа подвергаются испытанию, и его мир становится сложнее. Во время этого первого провала на графике герой может, например, страдать от неуверенности в себе или низкой самооценки, но затем обретает новое знание, новый опыт и новые способы самовыражения. В финале (а конец у этих историй обычно плохой) мы можем увидеть либо отсутствие завершенности, либо кризис – борьбу героя в условиях перемен, вызванных действиями другого человека.

Роман Хилари Мантел «Вулфхолл»[99], получивший Букеровскую премию, – еще один пример подобного сюжета. Это авторская интерпретация жизни Томаса Кромвеля при дворе Генриха VIII (в том числе в беспокойную пору, когда король хотел развестись с Екатериной Арагонской и жениться на Анне Болейн). Опасности подстерегают Кромвеля со всех сторон, и его история – это история человеческого упорства. В конце мы видим полную перестройку Церкви и государства в Англии. Кардинал Уолси умирает, а Анне так и не удается родить наследника престола. Это никак нельзя назвать счастливым финалом.

Другие романы этого вида: «Парижская жена»[100] Полы Маклейн, «Противостояние»[101] Стивена Кинга, «Время прощаться»[102] Джоди Пиколт и «Забытый сад»[103] Кейт Мортон.


Рис. 11. Сюжет пятого вида


Рис. 12. Сюжет шестого вида


Графики сюжетов пятого и шестого видов (рис. 11 и 12) также являются зеркальным отражением друг друга. В обоих есть перелом примерно в середине, поэтому для них характерен двойной провал (W-образный график) или двойной пик (М-образный график). К пятому виду относятся такие романы, как «Дневник памяти»[104] и «Последняя песня»[105] Николаса Спаркса, «Дорога»[106] Кормака Маккарти, «Надейся умереть» Джеймса Паттерсона и «Французская сюита»[107] Ирен Немировски. Этот вид близок к тому виду сюжета, который Букер называл «путешествие и возвращение». Для Букера это история персонажа, который вынужден погрузиться совершенно в иной, чуждый ему мир, понять его очарование, пережить резкие изменения к худшему, а затем – счастливую развязку и возвращение к своей нормальной жизни. Букер приводит в качестве примера множество историй, в которых герой физически оказывается в странном, неизвестном мире, – например «Алиса в Стране чудес»[108] и «Путешествия Гулливера»[109]. Впрочем, путешествие может быть также эмоциональным или умственным. Каждый из главных героев «Дневника памяти», влюбленных, оказывается лицом к лицу с миром воспоминаний другого, с чужим богатством или бедностью. И оба попадают в неизведанный мир, когда Элли теряет рассудок и забывает большую часть их общей истории. Сюжет этого вида часто выбирают для любовного романа; в таком случае первый пик – это любовная сцена в середине книги, а затем герои в силу каких-то обстоятельств расстаются и к концу воссоединяются.

Сюжет шестого вида (рис. 12) – это история Поиска. Это книга о том, как ищут и находят, осваивают неизведанные земли, сражаются с чудовищами – в буквальном или переносном смысле, – переживают неожиданные приключения, крушение надежд, и наконец поиск в том или ином смысле завершается. Вот некоторые романы, отнесенные нашей компьютерной программой к этой группе: «Поправки»[110] Джонатана Франзена, «Сатанинские стихи»[111] Салмана Рушди, «Улица светлячков»[112] Кристин Ханны, «Телефонный звонок с небес» Митча Элбома и «Любить того, кто рядом» Эмили Гиффин.


Рис. 13. Сюжет седьмого вида


Сюжет последнего вида, седьмого (рис. 13), не имеет инвертированной пары. Курт Воннегут называет его «историей человека в яме»[113], а Букер – «победой над чудовищем». В нем часто фигурируют главный герой и главный злодей, а также некая опасность для человека или народа, которую следует устранить. Угрозой может быть дракон или эпидемия, ситуация или система, но главный герой вынужден принять вызов, а затем переломить ситуацию в свою пользу. К романам с сюжетом этого вида относятся «Однажды на берегу океана»[114] Криса Клива, «Девушка из Бостона»[115] Аниты Диамант, «Вердикт» («Сбежавшее жюри»)[116] Джона Гришэма, «Серебристый луч надежды»[117] Мэттью Квика и «Хуже, чем мертвый»[118] Шарлин Харрис.

Учитывая, что все остальные виды сюжетов сгруппированы попарно, мы задумались о том, что получится, если инвертировать график сюжета седьмого вида – и получить потенциальный восьмой вид сюжета, в котором сначала все плохо, потом становится немного лучше, а заканчивается опять очень плохо. Наш компьютер не вывел такой модели – «человек на горе», которая была бы парной к «человеку в яме». Ни у одного бестселлера ни в каком жанре не было такого сюжета. Но мы решили, что это естественно: кто стал бы читать такой роман?

Мы уже сказали, что существуют бестселлеры с сюжетами всех семи видов. Это правда, но в то же время мы обнаружили, что во всем нашем корпусе текстов лишь у немногих сюжет по виду близок к «Пятидесяти оттенкам». Список книг, наиболее похожих на этот роман, приведен в конце главы, но вот вам имена нескольких авторов оттуда: Стивен Кинг, Джеки Коллинз, Дэн Браун, Сильвия Дэй, Даниэла Стил, Ли Чайлд, Джеймс Паттерсон. Их книги расходятся миллионными тиражами.

Одинокие звезды

За последние два десятка лет две книги для взрослых имели бешеный успех (когда мы говорим «книги для взрослых», мы на самом деле хотим сказать «не “Гарри Поттер”»): «Пятьдесят оттенков серого» Э. Л. Джеймс и «Код да Винчи» Дэна Брауна. «Код да Винчи» – единственный в нашей коллекции бестселлеров роман, практически совпадающий по ритму с «Пятьюдесятью оттенками» (хотя из двадцати пяти романов Дэна Брауна только «Инферно» обладает трехчастной композицией, близкой к композиции «Оттенков»). Если наложить графики двух романов друг на друга, результат впечатляет. Он наводит на мысль о том, что можно вывести какие-то закономерности и опровергнуть расхожее мнение о случайности успеха обоих романов.


Рис. 14. «Код да Винчи» и «Пятьдесят оттенков серого»


Посмотрите: сюжетные кривые двух совершенно разных книг почти в точности (если не считать самого конца) повторяют друг друга (рис. 14). С первого взгляда кажется, что у них нет ничего общего: разные авторы, разные жанры, разные темы и стили. Но оба автора нашли путь к сердцу читателя и сумели увлечь его так, как мало кому из писателей удавалось. В нашем корпусе текстов найдутся книги с подобным ритмичным биением, но у «Пятидесяти оттенков» и «Кода да Винчи» самый регулярный ритм из всех. Расстояния между соседними пиками примерно одинаковы, между соседними провалами – также; расстояния от каждого пика до ближайшего провала тоже приблизительно равны. Это значит, что писатели очень чутко уловили тот ритм, к которому наиболее чувствительны читатели (а в данном случае речь идет о читателях всего мира) – и который заставляет лихорадочно переворачивать страницы. Обеим книгам свойственна симметрия, что весьма необычно; различаются они только тем, что «Пятьдесят оттенков», будучи первой книгой трилогии, а не самостоятельным романом, кончаются в низкой точке, заставляя читателя с нетерпением ждать выхода второй части. В обоих романах действия героев в высших и низших точках сюжета почти всегда физические – они выражаются в движении, и читатель откликается на них всем нутром. Герои тяжело дышат – и читатели тоже. В книге Джеймс высшие точки всегда связаны с сексом; у Брауна – это моменты, когда герои переводят дух между очередной погоней за кем-то и очередной необходимостью спасаться (см. рис. 15).


Рис. 15


Что такое этот ритм – случайная удача или плод обдуманной стратегии? Ответ знают лишь сами авторы. Но, кажется, эти графики позволяют решить одну из важнейших загадок литературы: увидев подобную кривую, мы будем точно знать, что в рукопись стоит вложить деньги!

Так как же это делается? Как взять нечто нематериальное – эмоциональный отклик и физиологическую реакцию читателя – и воплотить на странице, черным по белому? Выразить эмоциональные взлеты и падения героев в виде графика нам помогло то, что специалисты по обработке естественного языка называют анализом тональности[119]. Его обычно применяют для обработки рецензий на фильмы и отзывов о товарах, но мы обнаружили, что те же инструменты и методы годятся и для анализа повествования. Основная идея такова: компьютер читает книгу от начала до конца, обращая особое внимание на слова, описывающие негативные и позитивные чувства героев. Возьмем простую сцену из «Кода да Винчи». Софи с нежностью вспоминает, как разгадывала свой первый шифр – на арке, которую показал ей дед, когда в детстве привозил ее в Рослинскую часовню:

Дед… подвел ее к высокой сводчатой арке, которую показывал чуть раньше.

Софи плюхнулась на каменный пол, улеглась на спину и начала разглядывать удивительные рисунки над головой.

– Да я запросто разгадаю этот код! Ты и вернуться не успеешь!

– Тогда поспеши. – Дед наклонился, поцеловал ее в лоб и направился к ближайшей боковой двери. – Я выйду только на минутку. Дверь оставлю открытой. Если что понадобится, позови. – С этими словами он вышел в мягкий вечерний свет[120].

Это лишь одна из многих похожих интерлюдий в лихорадочно скачущем повествовании. В таких интерлюдиях Браун приостанавливает действие и рассказывает предысторию героев. Наш компьютер распознает подобные моменты как передышки – позитивные паузы в стремительном беге событий. Воспоминания Софи – добрые; эта сцена показывает нам нечто личное, мягкое, позволяющее немного помедлить и задуматься посреди сюжета, наполненного активным действием. В этой сцене мы чувствуем человеческую теплоту.

Относительно благополучные детские воспоминания Софи контрастируют с памятью Сайласа о его собственном детстве:

И тем не менее душу его терзали воспоминания. «Отпусти свою ненависть, – приказал себе Сайлас. – Оставь должникам своим». Глядя на каменные башни Сен-Сюльпис, Сайлас пытался побороть знакомую тягу… силу, что всякий раз увлекала его мыслями в прошлое, снова заточая в тюрьму, стенами которой в молодости ограничивался весь его мир. Эта память всегда обрушивалась бурей на все чувства сразу… вонь гнилой капусты, смрад смерти, человеческой мочи и фекалий. Вопли безнадежного отчаяния, заглушаемые воем ветра над Пиренеями, и тихие рыдания всеми забытых людей[121].

Разница в чувствах двух героев, предающихся воспоминаниям, очевидна. Так же очевидна она и для компьютера.

В ходе повествования эти моменты позитивных и негативных эмоций то накапливаются, то рассеиваются. Это увлекательно и динамично – так что читатели каждого романа будто совершают уникальное путешествие по мере того, как автор своей волей проводит их через периоды конфликта и разрешения, необходимые для того, чтобы события развивались во времени. На макрошкале эти накопленные моменты становятся чем-то вроде знаков препинания на нарративной линии романа. А самые низкие и самые высокие точки эмоционального напряжения, обнаруженные компьютером, соответствуют самым важным сценам, в которых происходят повороты сюжета. На основе этих данных компьютер рисует график романа – в более мелком (микро) или более крупном (макро) масштабе.

Под конец главы заметим: исследования тысяч книг демонстрируют нам, что в бестселлерах могут встречаться любые из основных трехчастных видов сюжета. Не обязательно у истории о «человеке в яме» будет больше шансов на успех, чем у истории об «очередной Золушке». И хотя макроуровень большого значения не имеет, то, как автор организует ритм повествования от сцены к сцене, – чрезвычайно важно. Тот танец, в котором каждое движение – на вес золота, требует ровного, четкого и размеренного ритма.

Списки: сюжет

Десять романов, чья макроформа наиболее близка к «Пятидесяти оттенкам серого»

1. «Инферно», Дэн Браун (Inferno, Dan Brown)

2. «Смертельное слово», Ли Чайлд (Killing Floor, Lee Child)

3. «Лаки», Джеки Коллинз (Lucky, Jackie Collins)

4. «Пылающая комната», Майкл Коннелли (The Burning Room, Michael Connelly)

5. «Сплетенная с тобой», Сильвия Дэй (Entwined with You, Sylvia Day)

6. «Сфера», Дэйв Эггерс (The Circle, Dave Eggers)

7. «Зов кукушки», Роберт Гэлбрейт (The Cuckoo’s Calling, Robert Galbraith)

8. «Искусство поля», Чед Харбах (The Art of Fielding, Chad Harbach)

9. «Куджо», Стивен Кинг (Cujo, Stephen King)

10. «Время прощаться», Джоди Пиколт (Leaving Time, Jodi Picoult)

Десять романов с наиболее удачным ритмом (за исключением «Пятидесяти оттенков серого» и «Кода да Винчи»)

1. «Игры патриотов», Том Клэнси (Patriot Games, Tom Clancy)

2. «Зубы тигра», Том Клэнси (The Teeth of the Tiger, Tom Clancy)

3. «Проект “Рози”», Грэм Симсион (The Rosie Project, Graeme Simsion)

4. «Я покорю Манхэттен», Джудит Кранц (I’ll Take Manhattan, Judith Krantz)

5. «Игра престолов», Джордж Р.Р. Мартин (A Game of Thrones, George R. R. Martin)

6. «Алекс Кросс, беги», Джеймс Паттерсон (Alex Cross, Run, James Patterson)

7. «Воскресенья у Тиффани», Джеймс Паттерсон (Sundays at Tiffany’s, James Patterson)

8. «Полярная звезда», Мартин Круз Смит (Polar Star, Martin Cruz Smith)

9. «Дорогой Джон», Николас Спаркс (Dear John, Nicholas Sparks)

10. «Костры амбиций», Том Вулф (The Bonfire of the Vanities, Tom Wolfe)

4. Дебютанты, или Почему важна каждая запятая

В начале июля 2013 года одному американскому ученому неожиданно позвонили с другой стороны Атлантики. Незнакомец на том конце провода попросил помощи в разгадывании загадки. Ученый был выбран за особое умение – находить скрытые закономерности, поправляя ошибки историков. Через неделю он оказался в центре внимания мировой прессы, его имя склоняли в международных новостях.

Это звучит как завязка очередного романа Дэна Брауна, верная заявка на стомиллионный тираж. Однако в этом случае ученого звали не Роберт Лэнгдон, а Патрик Джуола; исследователь не символов, а стиля, и исследовать предстояло не историю католической церкви, а книги Дж. К. Роулинг. Репортер газеты Sunday Times попросил Джуолу, преподавателя компьютерных наук и специалиста по установлению авторства с помощью компьютера, проанализировать новый роман. Он назывался «Зов кукушки» и принадлежал перу некоего Роберта Гэлбрейта. Автор-дебютант, по-видимому, решил написать детектив по материалам своей многолетней службы в Королевской военной полиции. Но репортеру дали наводку – намекнули, что никакого Гэлбрейта на самом деле не существует, а книга написана создательницей «Гарри Поттера». Правда ли это? Джуола взялся за дело. Через полчаса компьютер выдал ему данные, позволяющие заключить, что анонимный информатор был прав. Мог ли Джуола доказать, что автор – Роулинг? Нет, но готов был держать пари, что это так. 13 июля Дж. К. Роулинг хотя и неохотно, но все же созналась, что автор – в самом деле она.

Роулинг заявила, что выпустила роман под именем Роберт Гэлбрейт, чтобы получить объективные отзывы без оглядки на прежние достижения автора. Человеку, написавшему «Гарри Поттера», книгу с 500-миллионным тиражом, нелегко укрыться от всевидящего ока публики, которое следит за каждым шагом знаменитости. Суждено ли Роулинг когда-либо получить беспристрастную оценку, не искаженную магнетическим полем ее славы?

Вероятно, нет. Разве что она скроется под псевдонимом. Но, как убедилась Роулинг, создать себе имя заново не так просто. Она поменяла все – жанр, читательскую аудиторию, тематику, структуру сюжета. Она утверждала, что намеревалась «писать от имени своего внутреннего мужчины», писать, вообще говоря, «как мужчина», как мужчина по имени Роберт. Поскольку новая книга была адресована взрослому читателю, а не детям, Роулинг поменяла также и свой авторский словарь, перейдя на более сложную лексику. Но, как ей довелось узнать, не так просто изменить или спрятать свои лингвистические «отпечатки пальцев».

Поясним на примере. У Джоди светлые волосы, голубые глаза и рост 160 сантиметров. Эти характеристики нельзя назвать элементами стиля, они – проявление генотипа Джоди. Она может попытаться их изменить: надеть контактные линзы другого цвета, перекраситься в брюнетку и ходить на каблуках или в мужской одежде. Но чтобы изменить свой генотип, Джоди придется прибегнуть к генной инженерии, иначе ее ДНК по мере обновления клеток будет воспроизводить одни и те же заложенные в них закономерности. Джоди может носить деловые костюмы или праздничные платья, чтобы изменить свой имидж. Она может менять фасоны одежды каждые три месяца, если захочет. Но то, что досталось ей от природы, она изменить не в силах. Структура ее тела, его исходные свойства не изменятся. И достаточно одной пряди волос, в какой цвет их ни покрась, чтобы специалист узнал о Джоди все, – лишь бы под рукой оказался подходящий микроскоп.

Странно и даже поразительно: текст, написанный человеком, содержит в себе нечто вроде его писательской ДНК. Конечно, уникальные особенности использования слов автором – не то же самое, что экспрессия генов. Но за годы исследований в области установления авторства и стилеметрии ученые поняли, что у каждого человека есть неповторимый, индивидуальный языковой стиль – что-то вроде отпечатка пальца. Даже когда Дж. К. Роулинг пыталась – совершенно сознательно – писать как «Роберт Гэлбрейт», а не как Дж. К. Роулинг, в тексте проявились закономерности и привычки, которые ей подавить не удалось. Компьютеру Джуолы хватило нескольких минут, чтобы выявить эти закономерности в аспектах, на которые мы обычно не обращаем внимания, – например в использовании предлогов, существительных и характерных грамматических конструкций.

Конечно, некоторые писатели похожи друг на друга, как и люди бывают похожи внешне. В ситуациях, когда действуют общепринятые правила, различные авторы могут делать один и тот же выбор. Например, при написании делового письма. Подобным же образом на стиль каждого автора влияют внешние факторы – например предназначение текста и аудитория, которой он адресован. Представьте, какое чудовищное замешательство испытывает человек, нажав на кнопку «Отправить» и секунду спустя поняв, что по ошибке отправил имейл не на тот адрес! Как правило, мы пишем своему начальнику не так, как своему лучшему другу, даже если в обоих письмах говорится о том, что нам давно следовало бы повысить зарплату. По всем этим причинам бывает нелегко отличить одного автора от другого или от того же автора, но в других обстоятельствах. Тем не менее на каком-то уровне у всех нас есть бессознательные стилевые привычки. Не важно, обдумываем ли мы каждый эпитет и каждую запятую или пишем второпях – у каждого есть своя «лингвистическая мимика». Эти приметы нашего личного стиля не видны невооруженному глазу, но их можно выявить с помощью алгоритма, поэтому их удобно называть «лингвистической ДНК». Конечно, ДНК с генетической информацией и «лингвистическая ДНК» – разные вещи, но между ними можно провести ряд интересных параллелей. Исследования Мэтта в соавторстве с Даниэлой Уиттен показали, что некоторые методы машинного обучения, разработанные специально для анализа генетической ДНК, равно эффективны для анализа лингвистических данных[122].

Если в двух словах, то гены определяют, как будет функционировать клетка. Ученые и статистики, работающие в области биоинформатики, иногда анализируют данные экспрессии генов для предсказания различных биологических результатов. Оказывается, степень проявления экспрессии определенных генов может служить индикатором онкологических заболеваний. Если представить, что слова аналогичны генам, то можно сказать, что слова-гены определяют, как функционирует книга. Во 2-й главе мы видели, что слова могут быть кирпичиками, из которых строятся темы. Особенно существительные – они могут много рассказать о темах, раскрываемых в книге. Но роман – нечто большее, чем список тем, и, чтобы определить, станет ли он бестселлером, нужно смотреть на самые разные параметры, а не только на тематический профиль.


Пособие Стивена Кинга начинающему литератору, «Как писать книги», содержит его глубокие размышления о стиле разных авторов и о том, из чего этот стиль состоит. Кинг советует, чтобы писать хорошо, завести «ящик с инструментами» – словарный запас, естественный для вас как автора. Кинг также настаивает на использовании правильной грамматики. Он рекомендует начинающему писателю понять, как разные факторы – например, длина абзаца – влияют на тон и темп рассказа. У романа со стремительным, напряженным сюжетом абзацы, скорее всего, будут короче и выразительнее. И так далее. Судя по тому, как глубоко Кинг размышляет о стиле, можно было бы ожидать от него эффективного писательского «переодевания». Но его попытку тоже разоблачили.

В конце 70-х Кинг решил скрыться под псевдонимом Ричард Бахман. Тогда его занимал вопрос, который он формулировал как «талант или удача?». Он, как позже Роулинг, заявил: «Я хотел посмотреть, что будет, если издать новую книгу не под именем уже известного писателя». В случае с Кингом не понадобился даже компьютер. Его разоблачил владелец книжного магазина. Под именем Бахман Кинг выпустил роман «Худеющий»[123], и один рецензент по иронии судьбы выразился так: «Этот роман мог бы принадлежать перу Стивена Кинга, если бы Стивен Кинг умел писать»[124]. Первые книги Бахмана имели не слишком большой успех, но «Худеющий» расходился вполне пристойно. Его прочитал владелец книжного магазина в округе Колумбия и решил: если это не Кинг, то это лучшая имитация стиля Кинга, какую ему доводилось видеть. Он написал издателю Кинга – и писатель решил во всем сознаться в интервью.

Конечно, как только стало известно, что Бахман – это Кинг, продажи «Худеющего» подскочили с 40 до 400 тысяч и роман вышел на первое место в списках. Книги Роберта Гэлбрейта тоже подскочили в списках, когда стало известно, что «он» на самом деле Дж. К. Роулинг. Но верно и другое: когда оба автора, скрываясь за псевдонимами, заново выступили в качестве дебютантов, степень их писательского мастерства оказалась явно выше, чем у среднего новичка. Как могли двое никому не известных дебютантов, Бахман и Гэлбрейт, все же найти столько читателей на рынке хоррора, триллеров и детективов, где конкурируют тысячи писателей? И – раз уж зашла об этом речь – каким образом писатели-новички завоевывают аудиторию? Во многом с помощью привлекательного для читателей стиля.

Интересно, что под «привлекательным стилем» мы сейчас понимаем совсем не то, что мог бы подразумевать рецензент из журнала New Yorker: иллюстрируя это понятие, он, возможно, привел бы в качестве примера красивую метафору, способность автора подобрать абсолютно точное слово, выразить сложные чувства, которые большинство из нас может лишь испытывать, но не в состоянии описать. Рецензенты занимают важное место в литературном мире, а стилеметрия, вместо того чтобы дублировать их работу, стремится ее дополнить другими интересными и важными находками. Что мы ищем с помощью алгоритмов, анализирующих стиль? Вовсе не изысканную иронию, которая так восхищает отточенной формулировкой в идеально построенной фразе, или острое наслаждение, которое возникает, когда что-то хорошо знакомое описано совершенно по-новому. Вместо этого мы анализируем самые обыденные и на первый взгляд скучные характеристики авторской прозы – дело в том, что именно они могут гораздо точнее предсказать, какому писателю суждено достичь успеха, а какому – нет. А вот наличие утонченных метафор таким критерием не является.

Оказывается, частота, с которой Кинг использует артикль the (например, в книге «Мистер Мерседес» она составляет 4,8 %), а Роулинг – предлог of (2,1 % в «Зове кукушки») – точные индикаторы успеха на рынке. Конечно, эти писатели уже прославились, а значит, вы можете возразить: «Ну да, у Кинга все в порядке с артиклями, но у него еще и денег на рекламу выделено немало». Но дело в том, что правильно подобранные служебные слова и прочие грамматические мелочи также определяют, станет ли бестселлером самый первый роман писателя-новичка.

Короче говоря, стиль очень важен. Это механизм, который доносит до читателя и сюжет, и тему, и характеры персонажей. Стиль одновременно механичен и органичен; это результат сочетания природных способностей и воспитания, врожденного таланта и приобретенного мастерства. И конечно, стиль играет важнейшую роль в успехе писателей, с первым же творением попадающих в список бестселлеров NYT. Сказать, что дебютанту трудно туда попасть, – значит ничего не сказать. Рынок переполнен сотнями тысяч книг – триллеров, любовных романов, детективов, семейных саг и произведений серьезной литературы. Если смотреть на темы и сюжеты, многие из этих романов оказываются чуть ли не близнецами. Как заметил финалист Букеровской премии Чигози Обиома в недавнем интервью Би-би-си, не существует новых сюжетов, новых рассказов – только новые способы рассказать о том же самом. Обиома говорит как раз о стиле. Стиль важен. Именно стиль помогает писателю-дебютанту продемонстрировать свою новизну и занимательность, а не показаться затертым и предсказуемым. А когда мы запрограммировали компьютер для анализа стиля тысяч недавно вышедших книг, выяснилось, что, по мнению алгоритмов, определяющих возможность успеха, именно стиль позволяет по-новому рассказать старую сказку.

Покупка цветов

Компьютерный анализ авторского стиля – отрасль прикладной лингвистики, иногда также называемая стилеметрией. В литературной критике ее методы используются для уточнения вопросов авторства канонических средневековых текстов, таких как «Сэр Гавейн и зеленый рыцарь», или выяснения, действительно ли Шекспир писал пьесы, опубликованные под его именем. Но область применения этих методов выходит за пределы литературоведения. В одном судебном деле анализ текстов помог добиться предоставления политического убежища, в другом – доказать факт плагиата. Юридические (как гражданские, так и уголовные) последствия установления авторства могут быть столь серьезны, что появилась целая отрасль стилеметрии, называемая криминологической лингвистикой. Специалисты этой отрасли анализировали самые разные тексты, от манифеста Унабомбера до письма с требованием выкупа за Джонбенет Рэмси. Ответ на вопрос, кто что написал, может навсегда изменить чью-то жизнь[125].

В книжном деле – особенно для писателя-дебютанта – главный судьбоносный вопрос не в том, кто это писал, а в том, как это написано. В отличие от литературных тем стиль прозаика трудно уловить без конкретных примеров. Мы считаем, что первая строка романа многое сообщает о стиле писателя. Вот три известных первых предложения популярных романов.

Вирджиния Вулф открывает «Миссис Дэллоуэй»[126] элегантно: «Миссис Дэллоуэй сказала, что сама купит цветы»[127].

Лев Толстой начинает «Анну Каренину» проницательным замечанием: «Все счастливые семьи похожи друг на друга, каждая несчастливая семья несчастлива по-своему».

Джейн Остин начинает «Гордость и предубеждение»[128] колкостью: «Все на свете признают за истину, что состоятельному холостяку следует обзаводиться женой».

Эти предложения цитируются так часто – их хвалят, превозносят и практически возводят в ранг канона, – что любой читатель или писатель может однажды задуматься о них. Почему они эффектны? Первое, что сразу становится ясно по этим трем предложениям, – у каждого из трех писателей-классиков есть свой, узнаваемый, голос. Обратите внимание на характеристики предложений – длину, пунктуацию, относительную простоту. Кто-то обращается к нам, и его голос кажется живым, этот кто-то говорит как облеченный некой властью. Он не колеблется, не мнется, не осторожничает. Все прозаики решают эту задачу – создание в некотором смысле личности рассказчика. Читатели, возможно, замечали, что обычно не бросают книгу, если эта личность – привлекательная или отталкивающая – как минимум осознает свое существование и ведет читателя куда-то. Лучшие писатели – или, во всяком случае, те, кто привлекает наибольшее число читателей, – заявляют о своем присутствии с первого же предложения книги, используя крохотные и как будто не стоящие никакого труда стилистические полутона.

Джейн Остин и Джеки Коллинз нечасто упоминаются в одной фразе. И Стивена Кинга редко поминают рядом с Львом Толстым. Но, поскольку эти писатели – одни из самых популярных в мире, мы недаром заговорили о них. Вот начало романа Джеки Коллинз «Бедная маленькая стерва»[129]:

Белль Светлана стояла обнаженная перед зеркалом в полный рост, готовясь к свиданию с пятнадцатилетним сыном арабского нефтяного магната, которое ей должны были оплатить по ставке тридцать тысяч долларов в час.

А вот первая фраза ставшего классикой романа Стивена Кинга «Сияние»[130]:

«Разглагольствующий хрен-недомерок», – подумал Джек Торренс.

Для многих критиков разница между авторами этих предложений и писателями-классиками – это разница между «ширпотребом» и «большой литературой», что многие понимают как разницу между «чтивом» и «книгами, изучаемыми в университетах». Так было с тех самых пор, когда понятие бестселлера только появилось. Но к чему это высокомерие? Почему считается, что писатели-классики чем-то лучше этих двух современных авторов, достигших большого успеха? Разве нельзя рассматривать просто успех как таковой?

Давайте еще раз посмотрим на вступительные предложения Остин и Коллинз. В них есть нечто общее. В обоих случаях мы видим женщину в довольно пассивном положении, во власти мужского патриархального уклада. Оба писательских голоса – с некоторой осознаваемой ими самими иронией – вводят нас в описываемый мир, в котором персонажи женского пола отдают секс и некое «право собственности на себя» в обмен на положение или деньги, которые могут исходить только от мужчины. Даже у Остин мы часто видим, как женщина оказывается в паре с мужчиной, заведомо столь же непривлекательным для нее, как пятнадцатилетний сын арабского нефтяного магната непривлекателен для Белль Светланы. У Остин подчинение женщины выражено в словоупотреблении и строении фразы: женой обзаводятся. Женщина загнана в конец предложения и определяется исключительно ее отношениями с мужчиной – как жена. Эффект усиливается благодаря сухой иронии, звучащей в преувеличении – «все на свете признают за истину». Какой великий писатель, постигший все бесконечные тонкости человеческих чувств, рискнет заговорить – особенно во вступительной фразе своего шедевра – об «истине», да еще признаваемой «всеми на свете»? Это огромные, неподъемно тяжелые слова. И для нас очевидно, что писательница именно иронизирует над существующим положением дел. И вот поэтому первое предложение Остин – блестяще. Чтобы достигнуть этого эффекта, она не прибегает к закрученному синтаксису, к бесконечным предложениям, которые свойственны некоторым классикам, способным написать три абзаца без единой точки. К тому, кто прочел вступительную фразу Остин вслух, не придется вызывать санитаров с кислородной маской.

Хотя критики, учителя и культурологи приучали нас ненавидеть Коллинз так же сильно, как мы обязаны были обожать Остин, стилистика их первых предложений во многом совпадает. Ведь Коллинз описывает то же самое явление, только в другой культуре. И стиль помогает ей добиться желаемого эффекта. Она намеренно сгущает избыточные детали – обнаженная перед зеркалом, тридцать тысяч долларов в час, арабский нефтяной магнат, его несовершеннолетний сын. Во всем этом сквозит усмешка автора, так же как и у Остин – в заявлении о «всеми на свете признаваемой истине». Мы видим два общества, в которых женщины вынуждены получать от мужчин деньги, пользуясь единственным орудием – сексуальностью. Но если это так, не намекает ли Коллинз с улыбкой – учитывая пришедшую за два века свободу нравов, – что у ситуации, столь деликатно описанной Остин, появилось новое решение? И разве ее вариант подачи этой ситуации в предложении не выражает – возможно, в стиле, более соответствующем эпохе, – те же чувства, что и у Остин?

Конечно, многие ополчатся на книгу Коллинз, поскольку считают неприемлемой проституцию или секс с несовершеннолетними. Вероятно, многие из осуждающих Коллинз одобрят первое предложение книги Вирджинии Вулф: «Миссис Дэллоуэй сказала, что сама купит цветы». Здесь женщина занимает совсем иное положение. Обратите внимание, что миссис Дэллоуэй играет активную роль – она сама управляет своей судьбой. Но заметьте также, что, несмотря на это, она описывается как «миссис», а не «Кларисса Дэллоуэй». Такой выбор слов показывает, что автор осознает традиционные гендерные роли. Кстати говоря, наш алгоритм внимательно регистрирует в том числе и употребление слов «миссис» и «жена». Вне контекста все эти «мелочи» кажутся набором случайных, поверхностных фактов, но в контексте, как мы уже начинаем сознавать, малозаметные авторские решения могут быть очень важны для понимания читателем того, что происходит в романе. То, что Вулф использует слово «миссис», указывает на то, что ее, как и других писателей, занимает вопрос отношений между мужчинами и женщинами в социальном контексте. Дэллоуэй решает купить цветы сама (обычно этот банальный жест – удел стереотипного романтического героя). Какой удар для патриархального строя! И, независимо от того, одобряете ли вы проституцию, нечто подобное можно сказать и о Белль Светлане, урожденной Аннабелль Маэстро, которая полностью управляет как своей судьбой, так и самым престижным эскорт-сервисом в Нью-Йорке.

О роли женщин в этих книгах можно спорить так же, как спорили о «Пятидесяти оттенках серого», – и конечно, читающие люди не могут не понимать, что это здоровая дискуссия, пусть порой речь и идет о болезненных для общества темах. Ради подобных дискуссий мы и читаем! Но не важно, нравится ли нам профессия Белль и одобряем ли мы самостоятельную покупку цветов миссис Дэллоуэй: если читателям не по вкусу поведение женщин, описанных в книге, стиль тут в любом случае ни при чем. Во всех трех рассмотренных цитатах стиль полностью выполняет авторскую задачу: эти вступительные фразы цепляют читателя.

Первое предложение «Анны Карениной» гениально благодаря выбранной автором параллельной структуре. «Все счастливые семьи похожи друг на друга, каждая несчастливая семья несчастлива по-своему». Простота звучания идеально дополняет мудрость содержания. Здесь Толстой делает то же, что и другие писатели, но по-своему: он признает, что все романы в конечном счете посвящены взаимодействию между людьми, в том числе – детско-родительским и семейным отношениям, и что в этих отношениях должно быть какое-то несчастье или конфликт, иначе не получится сюжета. Заявление Толстого не является истиной – так же, как и утверждения других писателей в первом предложении книги не являются истиной. Это – истина вымысла, она закладывает потенциал для создания вымышленного мира. Но такое вступление (как и другие рассмотренные нами) словно подает читателю сигнал: внимание, сейчас начнется сюжет!

Лучшие вступительные предложения (не важно, считают ли рецензенты те книги, которые с них начинаются, «серьезной литературой» или «чтивом») уже содержат в себе весь конфликт, который развернется на следующих трехстах страницах. И все это – в двадцати словах или даже меньше. Цель достигается за счет умелого использования грамматики и самых обыденных слов, которые мы едва замечаем. Вулф, например, заметила конфликт между титулом «миссис» и актом самостоятельной покупки цветов. Иначе она назвала бы героиню просто Клариссой. Тот, кто читает роман впервые, сразу зацепится за слово «миссис». Хм, подумает такой читатель, а существует ли мистер Дэллоуэй? И живет ли он до сих пор с женой? Может, они поссорились? Автор демонстрирует понимание структурных конвенций – от социальных до грамматических – и использует их, чтобы намекнуть на конфликт. Такой подход работает.

Теперь давайте взглянем еще раз на первую строку из романа Кинга. «“Разглагольствующий хрен-недомерок”, – подумал Джек Торренс». Возможно, кого-то из читателей смутит вульгарное слово «хрен» – как кого-то смутило намерение Белль Светланы совершить сексуальный акт за деньги. Однако эта фраза все равно выполняет свою задачу. Джеку Торренсу слово «хрен» нравится, а значит, мы уже кое-что о нем знаем. Напомним, искусство писателя состоит в том, чтобы создавать авторский голос с помощью стиля и повествования. Часть этой задачи – подбор слов: они должны подходить к описываемой сцене, характеру персонажа и выбранным грамматическим оборотам. Посмотрите, сколько всего вместилось у Кинга в шесть слов – три слова прямой речи и три авторской. Такая структура приятно ритмична. Предложение звучит хорошо при чтении вслух. Произнося его, почему-то испытываешь удовольствие. Обратите внимание на контраст между витиеватым словом «разглагольствовать» и грубо-просторечным «хрен». Здесь уже намечен микроконфликт, занимающий читателя. Как мы должны относиться к персонажу, с которым только что познакомились? Его язык – даже в мысленной речи – свидетельствует о том, что герой наделен определенной силой, авторитетом. Все авторские голоса в первых предложениях, которые мы до сих пор рассматривали, звучат уверенно и весомо. Другой многообещающий конфликт – между словом «подумал» и жесткой энергией слова «хрен». Почему Джек не произнес это слово вслух? Что произошло перед тем, как он это подумал? Почему он не может открыто высказать свое раздражение? Конечно, Кинг знает, как написать роман, увлекающий читателя, и здесь он с ходу погружает нас в пучину конфликта – между двумя обозначенными в первой фразе персонажами, противостояние которых становится ясно с первых же шести слов. Хороший стилист делает такие вещи сознательно: первое предложение – это наживка для читателя, сочетание авторского голоса и обещание конфликта. Нужный эффект достигается благодаря манере изложения и синтаксису. В данном случае задача исследователя-стилеметриста – найти самый надежный и простой способ научить компьютер считывать все эти хитросплетения разных параметров и сообщать, когда автор блестяще справляется со своей задачей.


В начале 90-х британский писатель Мартин Эмис вызвал сенсацию в прессе, получив за очередной роман аванс 500 тысяч фунтов стерлингов. Эмиса часто называли одним из ведущих английских писателей и хвалили именно за виртуозное владение стилем. Роман, за который был выдан аванс, вышел в 1995 году под названием «Информация»[131] (иронический кивок в сторону Джона Гришэма с его названиями из одного слова – «Фирма», «Клиент», «Камера»[132], каждый из которых побывал в списках бестселлеров). Книгу заметили в прессе. У нее также был определенный бюджет на рекламу. Но, несмотря на все это, она плохо продавалась – издатель позже сообщил, что тираж не достиг и 40 000 экземпляров. Почему? Возможно, мы поймем это, взглянув на ее первое предложение.

Сходство книги Эмиса с книгами Гришэма ограничилось названием. Роман Гришэма «Золотой дождь»[133] открывается следующей фразой: «Окончательное и бесповоротное решение стать адвокатом я принял, когда осознал, что мой отец адвокатскую братию на дух не переносит»[134]. В ней, как всегда у Гришэма, есть все необходимые составляющие: активное решение героя, намек на существование двух персонажей, упоминание семейных связей и конфликт. Язык простой, предложение легко читать, оно не перегружено придаточными. В нем нет лишних слов. Мы слышим голос и верим ему. Готово: все получилось.

А вот как начинается роман Эмиса: «Ночные города, мне кажется, полны мужчин, которые плачут во сне, а потом ничего не говорят об этом». Как нам удалось по первому предложению понять, что книга бестселлером не станет? Назовем только одну причину. В нем нет действия, нет взаимодействия, нет завязки для развития сюжета – ничего из того, что мы наблюдали в первых фразах бестселлеров. Оно полно слов, зияющих пустотой: «ночь», «сон», «ничего». Мы видим мужчин, которым не под силу даже признаться в собственных слезах. И кто такой этот «я», говорящий с нами? Облечен ли он властью? Чувствуем ли мы его авторитет, его искренность?

Скорее всего – нет, а причина – в стиле. Рассказчик не «знает» (и даже не «осознаёт», как у Гришэма) – ему «кажется». Более того, он как бы извиняется за это, отгораживаясь запятыми от остального предложения. Это не самый лучший способ преподнести читателям необычное утверждение. Слабая позиция автора выражена даже грамматически. Он не начинает с местоимения «я» и не пишет о себе в активном залоге. Он прячется за словами «ночные города» и за пассивным «мне кажется». Где людские сердца, где несколько персонажей, где намек на конфликт? Готовы ли мы пройти вслед за этим голосом триста пятьдесят страниц?

Нельзя сказать, что в первом предложении романа Эмиса есть какие-то изъяны. Оно правильно с точки зрения грамматики. В нем есть определенная философская глубина. Иные критики, пожалуй, найдут в нем литературные достоинства. Но оно не цепляет так, как цепляют первые предложения бестселлеров.

Вот еще несколько примеров удачных первых предложений. Все начинающиеся с них романы стали бестселлерами. В списке есть как традиционным способом опубликованные книги, так и те, что вышли самиздатом, как рассчитанные на массового читателя (так называемое чтиво), так и представители высокой литературы, а также один лауреат Пулитцеровской премии. Сможете ли вы определить, кто где?

Я часто жалею, что я – не британская монета в один фунт, а девушка-африканка.


Секрет в том, как умереть.


Кто не усомнился бы, услышав от собеседника, что он провел все выходные в обществе Бога?


Я родился дважды: сначала как младенец женского пола в странно чистый от смога январский день 1960 года в Детройте, а потом второй раз, в августе 1974, как мальчик-подросток, в отделении неотложной помощи недалеко от Питоски, штат Мичиган.


Белую девушку застрелили первой.


Она лежала на спине, крепко пристегнутая ремнями к узкой койке со стальной рамой[135].


Во время игры Шварц не замечал мальчика.


Я любила Нью-Йорк безумной и страстной любовью, какой удостоилось единственное другое существо в моей жизни[136].

Они все лаконичны, но при этом богаты, не правда ли? Они буквально кричат: «Сейчас начнет разворачиваться сюжет!» Конечно, понятие стиля касается не только первой фразы книги, но именно по ней часто можно понять, насколько хорошо автор контролирует то, что будет дальше, и насколько его стиль привлекателен для читателей.

Новогодние елки

Когда дело касается компьютерного анализа и сравнения стиля тысяч романов, работа не ограничивается изучением слов в первом предложении. Процесс гораздо сложнее. Наш анализ стиля начинается со сбора нескольких тысяч параметров. Они обычно касаются употребления заурядных слов – таких как of, the, a, and[137], but[138] и т. п. Но кроме этого мы собираем информацию о синтаксисе, длине предложений, пунктуации, частях речи, а также – о наиболее часто встречающихся в книге глаголах, существительных, прилагательных и наречиях. Мы знаем, например, как часто Джон Гришэм использует прилагательные, а также кто больше любит запятые – Даниэла Стил или Донна Тартт. Мы вычисляем относительную частоту употребления определенных слов для каждой книги. Например, мы знаем, что в «Коде да Винчи» Дэн Браун употребляет артикль the семь раз на каждую сотню слов. А Джон Гришэм в «Фирме» – чуть менее шести раз на сотню. Если бы нам дали неподписанную книгу, принадлежащую перу одного из этих двоих, мы могли бы вполне обоснованно предположить, кто ее автор, – на основании того, как часто в ней используется the. В «Дороге» Кормака Маккарти слово and – второе по частоте (после the), а he – третье по частоте, оно встречается чуть меньше четырех раз на сотню слов. А вот местоимение she в «Дороге» почти не используется – всего одно на две тысячи слов. Напротив, в «Зове кукушки» she – седьмое по частоте слово, примерно 1,5 раза на сотню. В романе Энтони Дорра о Второй мировой войне два главных героя – мальчик и девочка, и местоимения his и her[139] имеют абсолютно одинаковую частоту (примерно одно на сотню слов). А вот в романе Норы Робертс «Последняя любовь» her встречается вдвое чаще, чем his. При этом Робертс нечасто использует местоимение второго лица you[140]. Зато Николас Спаркс в «Дневнике памяти» и Адам Джонсон в «Сыне повелителя сирот»[141] демонстрируют свою любовь к этому слову (1,3 упоминания на сотню у Спаркса и 1,4 – у Джонсона). Такие детали могут показаться чересчур мелкими, но они подобны деталям отпечатков пальцев – те тоже мелкие, но от них могут зависеть вопросы жизни и смерти.

Наша модель берет самые элементарные составляющие стиля – даже не камни фундамента, а раствор, скрепляющий эти камни, – и показывает нам, как каждая из них фигурирует (или не фигурирует) в том или ином романе. Эти сырые данные об индивидуальных элементах дают нам базовую информацию о стиле автора – сколько он использует запятых, двоеточий, апострофов и прочих знаков препинания, а также самых простых и распространенных глаголов (таких как did[142] и want[143]), существительных (таких как man[144] и woman[145]), прилагательных и наречий. На этом уровне мы еще не задаемся вопросом, какие предложения более типичны для автора: Peter designated the common garden tool that digs, an instrument of weeding the unwanted[146] – или Peter called a spade a damn useful shovel[147]. Но с помощью стилеметрического анализа мы мгновенно устанавливаем, что в первом предложении слово the встречается два раза, that, of и an – по одному, а во втором два раза встречается артикль a, но нет ни одного из слов the, that, an, of. Все эти артикли, местоимения и предлоги позволяют в два счета понять, какого стиля придерживается автор. Более длинные предложения требуют связующих конструкций – чего-то вроде строительных лесов или подпорок. Узнав, с какой частотой автор употребляет эти и другие служебные слова, мы получаем его стилистическую «подпись». Совокупность всех частот – это стилистические «позывные» автора, они всегда одни и те же, независимо от того, какое имя стоит на рукописи – Роулинг или Гэлбрейт.

Мы ввели в бестселлерометр тексты нескольких тысяч книг и научили его замечать эти базовые элементы стиля. И наша система обнаружила, что для книг, попавших в список бестселлеров, характерны определенные стилистические предпочтения, повторяющиеся закономерности. По частоте всего 491 самых распространенных слов и знаков препинания машина смогла отличить бестселлеры от небестселлеров в 70 % случаев, а на основе всего лишь 148 параметров – в 68 %. Причем использовались помимо знаков препинания только самые распространенные служебные слова – никаких существительных, прилагательных, глаголов, данных о синтаксисе и строении предложений[148].

Мы рассмотрели результаты, полученные моделью, и обратили особенное внимание на параметры, указывающие, по ее мнению, на принадлежность книги к классу бестселлеров. Это позволило нам сделать ряд выводов о том, какой стиль делает книгу бестселлером, – и результаты нас немало удивили. В частности, из этих результатов как будто бы следовало, что женщины гораздо лучше мужчин умеют выбирать нужные слова и складывать их в нужном порядке. Но об этом мы поговорим чуть позже, а пока несколько более общих наблюдений. Глагол do[149] появляется в бестселлерах вдвое чаще, чем в книгах, которые в список бестселлеров не попали. Слово very[150] (Уильям Странк и Элвин Брукс Уайт в своем каноническом пособии «Элементы стиля»[151] называют это слово пиявкой, кишащей в пруду прозы) в бестселлерах встречается вдвое реже по сравнению с обычными книгами. Странк и Уайт были бы рады. Сокращение n’t[152] встречается в бестселлерах вчетверо чаще, чем в небестселлерах.

Не только n’t вместо not, но и другие сокращения встречаются в бестселлерах в среднем чаще по сравнению с обычными книгами. Возможно, на уроках литературы в школе вам подобные вольности не позволялись, но при написании популярной прозы этот прием рекомендуется, поскольку помогает создавать правдоподобный, искренний и современный авторский голос, необходимый для завоевания читательской аудитории. Голос повествователя – не важно, от первого или третьего лица – должен выглядеть подлинным и уместным, если автор хочет удержать читателя. Сокращение -’d[153] встречается в бестселлерах в двенадцать раз чаще, чем в книгах, не ставших бестселлерами; -’re[154] и -’m[155] – в пять раз чаще. Вордсворт одобрительно кричит из могилы: «Да, это повседневный язык простого человека!» Современные бестселлеры определенно развиваются в направлении, предсказанном Вордсвортом.

Другие неформальные выражения в бестселлерах также весьма популярны. Взять, например, словечко okay[156]. Оно в бестселлерах встречается втрое чаще, чем в прочих книгах. Слово ugh[157], которого в классической литературе не найдешь, также чаще попадается именно в бестселлерах. Персонажи бестселлеров любят задавать вопросы – в этих книгах вопросительные знаки встречаются заметно чаще. А вот с восклицательными знаками дело обстоит по-другому: чем больше их в книге, тем меньше ее шансы на успех. Популярные авторы знают, что подобные пассажи безумно раздражают читателя: «Уже стемнело! На лестнице раздался скрип! Наверно, это было привидение!» Страстную любовь гораздо правдоподобнее выражают слова «Я люблю тебя», чем «Я люблю тебя!!!». Кроме того, в первом случае читателю не захочется пристрелить автора.

Многоточие используется в нехудожественной литературе для указания на пропуски, а в беллетристике обычно обозначает незаконченную мысль. Читатели, как правило, без труда ее завершают: «Он опять был во фраке, и на мужественную челюсть легла пятичасовая тень. О боже…» Большинство людей на этом месте догадается, что «о боже» – это не жалоба. Одна из радостей чтения – ощущение близости к автору в такие моменты. В бестселлерах многоточие встречается часто, поскольку это один из способов установить понимание без слов между автором и читателями. Читатели такое любят.

Признаемся: фанатичные филологи вроде нас получают удовольствие от огромного количества данных, описывающих употребление слов. Возможно, вы представили себе, как мы вдвоем, с чашками кофе в руках, любуемся огромной таблицей, восторгаясь тем, что слово thing[158] попадается в бестселлерах вшестеро чаще, чем в небестселлерах. Эта картина не слишком далека от истины. Другие любители слов на нашем месте тоже обратили бы внимание на такой факт. Они удивились бы, как удивились мы, что ничем не примечательное слово thing служит индикатором успеха книги. Но изучение слов – не просто причуда интеллектуалов. Оно чрезвычайно много дает. Полученные данные на самом деле могут немало рассказать о том, как устроены самые успешные образцы прозы.

Представьте себе сцену: мужчина в баре. Ему не везет с женщинами. Он рассказывает сидящему рядом другу о том, что решил попробовать новую тактику: отныне он будет встречаться с пятью женщинами сразу. Друг, поперхнувшись пивом, отвечает. Вот два варианта ответа:

– Я сильно удивлюсь, если ты выживешь!

Или:

– Хм. Я сильно удивлюсь, если ты выживешь.

Какая из реплик звучит естественнее? Вот именно. Вторая. Обратите внимание на то, насколько иной стала интонация при совсем незначительных изменениях текста. Во втором варианте вместо восклицательного знака – междометие «хм» и точка в конце предложения, – и в реплике теперь легко читается мрачная ирония. Мы уже замечали, что восклицательные знаки реже встречаются в бестселлерах, а на этом примере видно, насколько богаче нюансами становится тон, если фраза не завершается оглушительным восклицанием. Точки, кстати говоря, тоже гораздо чаще встречаются в бестселлерах по сравнению с обычными книгами, а вот двоеточие и точка с запятой – значительно реже.

Эти характеристики мельчайших деталей индивидуального стиля автора, возможно, не слишком информативны, если брать каждую по отдельности. Однако вместе взятые они показывают важные закономерности в передаче авторского голоса и интонации, характерные для бестселлеров. Решение автора написать I’d вместо I would или you’re вместо you are важнее, чем кажется на первый взгляд. В бестселлерах прилагательные и наречия – особенно прилагательные – попадаются реже. Это означает, что предложения в бестселлерах короче и «чище», не загромождены лишними словами. Предложения не нуждаются в том, чтобы их драпировали дополнительными придаточными «для красоты». Никакое существительное не стоит того, чтобы описывать его тремя разными эпитетами. Глаголы (употребляемые в бестселлерах чуть чаще по сравнению с обычными книгами) не выигрывают, если к ним прицепить несколько хорошеньких словечек, с окончанием на «-но». Предложения в бестселлере – не новогодние елки, обвешанные всем подряд – гирляндами, шарами, мишурой, ангелами, звездами, и все это разных цветов, не гармонирующих друг с другом. Лучше взять простую елку и показать ее так, чтобы она стала живой и объемной.

Мужчины и женщины

На основании всех этих параметров (чаще всего незамечаемых), бестселлерометр вывел формулу идеального стиля. Когда мы взяли весь свой корпус бестселлеров и выстроили их исключительно по стилю, к нашему удивлению, оказалось, что во главе списка – почти одни женщины. Когда мы ранжировали книги по тематике и сюжету, картина была иная. Произведений авторов-мужчин в нашей коллекции бестселлеров было намного больше – почти на сотню. Но когда дело дошло до владения стилем, наиболее типичным для бестселлеров, женщины явно одержали верх. Более того, книги, которые наша модель отметила как лучшие по стилю, не обязательно принадлежали известным писателям. Многие из этих женщин попали в списки бестселлеров с первой же книгой. Мы взяли десять дебютных книг, занимающих самые высокие места в списке, – и оказалось, что девять из них написаны женщинами. Мы были крайне удивлены таким гендерным однообразием. Неужели авторам-женщинам легче попасть в список бестселлеров? Может, у них врожденное чутье на «гены» стиля, который способствует популярности?

Эти вопросы повели нас совершенно по иному пути, заставив отойти от намеченного ранее. Компьютерный анализ книг вообще часто преподносит сюрпризы, и в этом его прелесть. С этим сюрпризом мы решили разобраться. Мы хотели выяснить, насколько сильно выражен гендер в тексте. Предшествующие исследования в области установления пола автора с помощью компьютерного анализа достигли точности 83 %. Интересно, подумали мы, даст ли наша модель похожий результат?[159] Сможет ли система в самом деле определить пол автора, глядя всего лишь на способ употребления слова of и частоту других распространенных слов (таких как remember, myself, just[160])? С помощью стилеметрии уже удалось доказать, что Роберт Гэлбрейт на самом деле – Дж. К. Роулинг. Может ли компьютерная модель определить также, что «Дорога», «Сын повелителя сирот» и «Ганнибал»[161] написаны мужчинами? А «Парижская жена», «Комната»[162] и «Мертвые и забытые»[163] – женщинами? Научив компьютерную модель отличать мужчин от женщин, мы установили, что это возможно.

Но прежде чем мы обсудим, что это значит, следует указать, что компьютер иногда ошибался. Он угадал пол автора в 71 % случаев, но некоторые его ошибки заслуживают внимания. Одна из самых удивительных состоит в том, что многие самые успешные бестселлеры он приписал авторам-женщинам, когда на самом деле они были созданы мужчинами. Вот три книги Джеймса Паттерсона, которые получили высокий индекс потенциального бестселлера за стиль. Все три, по мнению нашего компьютера, были написаны женщинами. Это «Дневник Сюзанны для Николаса»[164], «Воскресенья у Тиффани» и «Четверо слепых мышат»[165]. «Воскресенья у Тиффани» проще всего объяснить: Паттерсон написал ее в соавторстве с Габриэль Шарбонне. Если стиль бестселлера действительно зависит от пола автора, этим можно объяснить «женскую руку», заметную в книге. «Дневник Сюзанны для Николаса» – другое дело. Насколько нам известно, Паттерсон писал ее один, и все же наш компьютер с уверенностью 99 % заявил, что она больше похожа на другие книги нашего корпуса текстов, написанные женщинами. Если бы не «Четверо слепых мышат», мы бы решили, что компьютер ошибся из-за жанра. И «Дневник Сюзанны для Николаса», и «Воскресенья у Тиффани» – любовные романы. (Не в обиду Николасу Спарксу будь сказано, но это территория авторов-женщин.) Однако жанр никак не поможет объяснить, почему компьютер и «Слепых мышат» приписал женщине. «Мышата» даже близко не лежали к любовному роману. Это один из самых жестких детективов Паттерсона из серии про Алекса Кросса. Какой же вывод тут можно сделать? Утверждаем ли мы, что часть огромного успеха Паттерсона объясняется его «женским» стилем? Не торопитесь. Конечно, книги Паттерсона привлекают и мужчин, и женщин, и, возможно, его стиль в некоторой степени тому причина. Разумеется, полученные данные сообщают нам о какой-то характеристике стиля писателя, вероятно – коррелирующей с полом. Но что это за характеристика?

Интерпретация данных в этом случае осложнена не только средним уровнем точности модели (которая для определения пола автора на основе стилистических маркеров составляет 71 %), но и индивидуальной вероятностью, приписываемой каждой книге. Здесь возникает большой соблазн – сделать громкое обобщение: «Чтобы преуспеть (во всяком случае, в литературе), мужчины должны уподобиться женщинам!» Но на самом деле полученные нами данные рассказывают иную историю, более сложную и менее сенсационную. Да, наша модель была уверена, что «Долорес Клейборн»[166] написана женщиной. Мы представили себе, какие заголовки появятся по этому поводу в газетах: «И Паттерсон, и Кинг пишут как женщины!» Но вслед за этим мы взяли другой роман Кинга, «Мистер Мерседес». На сей раз модель никак не могла определить, кто автор – мужчина или женщина. Она все-таки решила, что это мужчина, но с минимальным перевесом – с вероятностью всего 50,2 %. Похожий результат был получен для романа Дианы Гэблдон «Написано кровью моего сердца»[167]: в этом случае модель правильно определила пол автора, но с вероятностью лишь 53 %. Значит, стиль некоторых книг можно назвать «нейтральным». И действительно, оказалось, что примерно 25 % книг в нашей коллекции не обладают ярко выраженными признаками, указывающими на пол автора. Еще у 25 % такие черты есть, но выражены они нечетко. Однако у оставшихся 50 % машина определила пол автора с уверенностью свыше 90 %. На эти книги следовало посмотреть пристальнее.

Из пятидесяти авторов, насчет которых модель была уверена почти на 100 %, что это мужчины, она ошиблась относительно троих. Однако в тех 50 случаях, когда модель была уверена в том, что автор – женщина, она ошиблась 14 раз! Из этого можно сделать два вывода. Первый – что авторы-мужчины из нашего корпуса текстов обладают более постоянным и «однородным» стилем. Второй – что у авторов-женщин, представленных в нашем корпусе текстов, стиль более разнообразен. Это уже интересно, но дальше будет еще интереснее.

Три женщины, которых наша модель сочла мужчинами, – Тони Моррисон, Сара Блейк и Барбара Кингсолвер. Мы заметили, что у этих писательниц есть нечто общее, хотя, конечно, совпадение могло быть и случайным. Тони Моррисон не только пишет книги, но и преподает. Она получила Пулитцеровскую премию, Американскую книжную премию, Нобелевскую премию и Президентскую медаль свободы. У Сары Блейк – степень бакалавра искусств из Йельского университета и степень доктора философии из Университета Нью-Йорка. Блейк преподает писательское мастерство в нескольких американских университетах. Барбара Кингсолвер – магистр биологии, лауреат литературной премии Оранж и Дейтонской литературной премии мира за особые достижения, обладатель национальной гуманитарной медали США. Можно сказать, что эти три писательницы – в числе наиболее образованных и сведущих в литературе женщин, представленных в нашем корпусе текстов, с общепризнанными заслугами в области образования и литературы.

Теперь задумаемся о том, что первым среди авторов – носителей типично мужского стиля – наш компьютер счел Пола Хардинга за книгу «Россыпь»[168], удостоенную Пулитцеровской премии. Вторым в списке шел Чарльз Фрейзер с книгой «Холодная гора»[169], получившей Национальную книжную премию в области художественной литературы (США). Третьим был Энтони Дорр с романом «Весь невидимый нам свет», удостоенным Пулитцеровской премии. Четвертым – Кормак Маккарти с романом «Дорога», удостоенным Пулитцеровской премии. Пятый автор Пулитцеровской премии не получал, но журнал для профессионалов книжного дела Publishers Weekly много лет подряд объявлял его творения книгами года. Он удостоился многих наград – таких как Премия Библиотеки конгресса, – за творческие достижения. Этот автор – Джон Гришэм. Его «Апелляцию»[170] наша модель поместила на пятое место в списке. Может быть, полученные нами данные указывают на то, что главные американские учебные заведения выпускают авторов, пишущих как мужчины, вплоть до строения фраз?

Мы повнимательнее рассмотрели биографии этих пяти писателей. Как и у трех писательниц, в их судьбе наблюдались интересные параллели. Хардинг – бакалавр литературы и магистр гуманитарных наук в области писательского мастерства. У Чарльза Фрейзера – степень доктора философии по английскому языку. Энтони Дорр – бакалавр истории и магистр гуманитарных наук в области писательского мастерства. Гришэм – бакалавр бухгалтерии и доктор юриспруденции. Из всех пятерых только Маккарти не имеет университетского диплома. Однако он получил традиционное школьное католическое образование в Ноксвилле, после чего несколько лет учился на гуманитарном отделении Университета Теннесси. И, что неудивительно, в бытность свою студентом университета несколько раз завоевывал литературную премию Ингрэма Меррилла.

Чем больше мы изучали биографии писателей, тем сильнее уверялись, что компьютер неправильно связал пол автора с приметами стиля. Стиль, который наш компьютер счел мужским, на самом деле просто был наиболее «литературным»: в списке носителей «мужского» стиля Дж. Р. Р. Толкин и Салман Рушди стояли совсем недалеко от Фрейзера и Дорра. Тони Моррисон, попавшую в одну группу с ними, часто считают лучшим американским автором-женщиной в области серьезной литературы. Похоже, мы наткнулись не столько на «природную» разницу в стиле между мужчинами и женщинами, сколько на результат воспитания – влияние полученного образования. Неудивительно, что модель поместила в одну группу писателей – как мужчин, так и женщин, – получивших обширное образование в области классического литературного английского языка (так вышло, что эта область до сих пор во многом является вотчиной мужчин). «Более литературный» стиль этих писателей не случаен: он свидетельствует о том, что они поддерживают литературные традиции, и тень литературного истеблишмента лежит на их работе и на восприятии их обществом.

Чему же может научить нас другой конец списка?

Книги и авторы, классифицированные нашей моделью как «наиболее женские», тоже, оказывается, имеют нечто общее, но их общие характеристики – абсолютно другие. Три автора с «самым женским» стилем, по мнению нашей системы, – это Пола Хокинс, Терри Макмиллан и Кэтрин Стокетт. Оказывается, все они учились на журналиста или работали в прессе. Эта тенденция прослеживается почти во всем списке. Джейн Грин работала журналистом примерно с двадцати до тридцати лет. Лиана Мориарти в прошлом – фрилансер-копирайтер, рекламщик. У Кейт Джейкобс – диплом журналиста, она собиралась работать в журнальном издательстве. Лорен Вайсбергер писала для журналов, прежде чем добилась успеха как автор книг. Джессика Нолл была старшим редактором в журнале Cosmopolitan. У многих мужчин, которых компьютер поместил в группу писателей с «самым женским» стилем, карьера складывалась сходным образом. Джеймс Паттерсон бросил аспирантуру и ушел в рекламное дело. Гленн Бек раньше работал на радио и телевидении. Примерам нет конца. Короче говоря, этих авторов учили писать совершенно не так, как бакалавров литературы и носителей ученых степеней по писательскому мастерству. И эта учеба явно оставила след – достаточно глубокий, чтобы его можно было обнаружить с помощью стилеметрии.

Обучаясь писать как копирайтер или журналист, автор неминуемо перенимает доступный, разговорный язык и стиль, не слишком похожий на стиль Мелвилла и Генри Джеймса. Тех, кто пишет для журналов, специально обучают создавать авторский голос, хлесткие заголовки, цепляющий текст из коротких предложений, лучше всего подходящих для колонки или статьи. Мы не хотим сказать, что журналистское образование несовместимо со знанием литературного канона или что журналист не может написать роман, принадлежащий большой литературе. Но будет справедливым утверждение, что перечисленных выше авторов обучали писать стилем, привлекающим массовую публику и не рассчитанным на литературный истеблишмент. Неудивительно, что многие авторы этой группы попали в список бестселлеров со своей дебютной книгой. Они не снискали всевозможных литературных наград, но зато понимают возможности и могущество стиля и потому с первой же попытки взлетели прямо в стратосферу.

Когда мы ранжировали свой корпус текстов по наличию в них «привлекательного» стиля, в верхней части списка действительно оказалось много женщин. Но в их книгах проявляется не столько «женский» стиль, сколько склонность к «повседневному языку простого человека», которому Вордсворт заклинал нас подражать. У писателей-дебютантов, попавших в список бестселлеров с первой книгой, есть нечто общее – это не правило, но заметная тенденция. Писатели, которые явились вроде бы из ниоткуда и сразу взлетели на первое место в чартах (авторы книг «Девушка с татуировкой дракона», «Девушка в поезде», «Счастливые девочки не умирают», «Вязание по пятницам», «Дьявол носит Prada» и «Прислуга»), имеют отношение к журналистике. Их романы сохраняли место в списке бестселлеров – и не только в США, а по всему миру – в течение нескольких месяцев.

Так можно ли сказать, что Кинг и Паттерсон «пишут как женщины»? Нет. Они пишут как авторы, умеющие говорить с миллионами людей. Мы рады, что много женщин с дебютными романами попадает из Золушек сразу в принцессы, если можно так выразиться. Но пол автора тут ни при чем. Дело в том, насколько хорошо автор понимает аудиторию. Дело в природном чувстве языка, доведенном до совершенства кропотливой работой.

Списки: стиль

10 книг авторов-женщин – мастеров бестселлерного стиля

1. «Комната», Эмма Донохью (Room, Emma Donoghue)

2. «Темные тайны», Гиллиан Флинн (Dark Places, Gillian Flynn)

3. «Жених напрокат», Эмили Гиффин (Something Borrowed, Emily Giffin)

4. «Вязание по пятницам», Кейт Джейкобс (The Friday Night Knitting Club, Kate Jacobs)

5. «Тайна моего мужа», Лиана Мориарти (The Husband’s Secret, Liane Moriarty)

6. «Биение сердца», Даниэла Стил (Heartbeat, Danielle Steel)

7. «Штат Мэн», Кортни Салливан (Maine, J. Courtney Sullivan)

8. «Дикие лошади», Джаннетт Уоллс (Half Broke Horses, Jeannette Walls)

9. «Летите домой», Дженнифер Вайнер (Fly Away Home, Jennifer Weiner)

10. «Дьявол носит Prada», Лорен Вайсбергер (The Devil Wears Prada, Lauren Weisberger)

10 книг авторов-мужчин – мастеров бестселлерного стиля

1. «Первая семья», Дэвид Балдаччи (First Family, David Baldacci)

2. «Рождественский свитер», Гленн Бек (The Christmas Sweater, Glenn Beck)

3. «Шесть лет», Харлан Кобен (Six Years, Harlan Coben)

4. «Час, когда я впервые поверил», Уолли Лэмб (The Hour I First Believed, Wally Lamb)

5. «“Линкольн” для адвоката», Майкл Коннелли (The Lincoln Lawyer, Michael Connelly)

6. «Аббатство», Крис Калвер (The Abbey, Chris Culver)

7. «Жутко громко и запредельно близко», Джонатан Сафран Фоер (Extremely Loud & Incredibly Close, Jonathan Safran Foer)

8. «Дневник Сюзанны для Николаса», Джеймс Паттерсон (Suzanne’s Diary for Nicholas, James Patterson)

9. «Серебристый луч надежды», Мэттью Квик (The Silver Linings Playbook, Matthew Quick)

10. «С первого взгляда», Николас Спаркс (At First Sight, Nicholas Sparks)

5. Литература нуар, или Чего хотят девушки

– Скажите, отчего везде одни сплошные девушки?

Был теплый летний день в Нью-Йорке, на дворе стоял 2015 год, и все, кого ни возьми, читали «Девушку в поезде». А мы обедали со своей издательницей.

– Понимаете, я теперь вообще не могу пройти мимо рукописи, если у нее в заглавии есть слово «девушка». Может, надо хватать любую книгу, в которой есть девушка?

Она была серьезна лишь отчасти. Но мы все равно подхватили ее идею и начали развивать.

– «Девушка с татуировкой дракона». Всемирный блокбастер.

– «Исчезнувшая девушка»[171]. Бешеный успех.

– «Самая счастливая девушка на свете»![172] Она-то откуда взялась?

Действительно, с 2008 года вышел целый ряд успешных книг о разнообразных девушках. В 2008 году Стиг Ларссон выпустил «Девушку с татуировкой дракона», в 2009-м – «Девушку, которая играла с огнем», а в 2010-м – «Девушку, которая взрывала воздушные замки». В 2012 году Гиллиан Флинн покорила читателей книгой «Исчезнувшая девушка». Потом в 2015 году вышли сразу «Девушка в поезде» и «Самая счастливая девушка на свете». Все они стали не просто бестселлерами из списка NYT, а поразительными явлениями, которые в одночасье ворвались в литературный мир и завоевали читателей из всех демографических групп. Практически только они удержали на плаву многие книжные магазины. Единственным сравнимым примером мгновенного и неожиданного успеха, но без слова «девушка» в заглавии, были «Пятьдесят оттенков серого». А может, Ана Стил тоже одна из тех девушек?

Мы решили, что нет. Ведь книга не называется «Пятьдесят оттенков этой девушки» или «Девушка с пятьюдесятью оттенками». И тому есть причины.

– Ну так что, – сказала наша издательница, – все эти девушки – случайное совпадение или в них что-то есть?


Проблема с поиском закономерностей – в том, что если очень хочешь их найти, то обязательно найдешь. А найдя, захочешь объяснить. Так работает подражание в книжном деле. После «Девушки с татуировкой дракона» весь мир охватила мода на шведские детективы. Может, очередной ключ к успеху – это издание шведских писателей-детективщиков мужского пола? Как выяснилось – не совсем. Некоторые писатели вроде Ю Несбё и впрямь хороши. Другие – нет. Многие, многие другие. Их книги оказались полным мусором. Может, следующая лошадка, на которую следует ставить, – девушка, Лисбет Саландер? Возможно, очередная выигрышная тема – девушки?

В это легко поверить, глядя на списки бестселлеров после выхода серии Стига Ларссона. И впрямь, на день нашего обеда с издательницей девушки в заглавиях маячили повсюду. Но стоит ли внимания эта мода? Что она такое – признак чего-то важного или проявление склонности к подражанию? Мы вспомнили, что Ларссон, с которого, казалось бы, пошла эта мода, не вставлял в заголовок слово «девушка»: его книга сначала называлась «Мужчины, которые ненавидят женщин». Но британским издателям это название показалось чрезвычайно неприятным, и они его заменили. И похоже, были правы. Большинство читателей согласится, что название «Девушка с татуировкой дракона» гораздо привлекательнее «Мужчин, которые ненавидят женщин» – особенно если учесть тот факт, что среди читателей большинство составляют женщины. Поэтому, возможно, несколько издателей сразу предложили авторам изменить заглавия рукописей, добавив что-нибудь про девушку. Не исключено, что, следуя минутной моде, любую книгу – будь то триллер, любовный роман или произведение экспериментальной литературы, – опытный издатель мог переименовать в «Девушка, которая…», или «Вот так девушка», или даже «Девушка в поезде».

Подумав об этом, мы решили, что осторожность не помешает. Мы сказали издательнице, что лучше найти рукопись, которая ей действительно понравится, и назвать книгу «Наша девушка – круче всех».

Что в имени тебе моем?

На что влияет название книги? К примеру, удачно подобранное название может принести автору десять миллионов долларов. Это значит, что его стоит тщательно обдумать. Иногда названия бестселлеров указывают на место действия: «Холодная гора», «Покрашенный дом»[173], «Черный дом»[174], «Остров проклятых»[175], «Штат Мэн»[176]. Каждое из этих названий нам что-то говорит – по крайней мере, мы можем понять, где происходят события, насколько это известное место и какую роль оно играет в сюжете. Вероятно, роман, действие которого разворачивается в покрашенном доме, будет отличаться по настроению от того, действие которого происходит в черном доме. Литературное путешествие на Остров проклятых, скорее всего, послужит толчком совершенно к иным событиям, чем поездка в штат Мэн. Если заглавие книги указывает на конкретный географический объект, мы ожидаем, что в любом другом месте события развивались бы иначе или не произошли бы вовсе. Иначе такое заглавие не годится. Место действия обеспечивает первый толчок к завязке сюжета, точнее, должно обеспечить, если роман хорошо написан и удачно назван. К концу такого романа читатель неизбежно сроднится с местом действия, будто оно что-то говорит его сердцу и без слов.

Название бестселлера может отражать и определенное событие, и читатель вправе ожидать, что это событие не просто один из проходных моментов сюжета, а нечто важное, сюжетообразующее. Примеры таких названий: «Несчастный случай»[177], «Смерть приходит в Пемберли»[178], «Падение гигантов»[179], «Один день»[180], «Поцелуй»[181], «Визит карательной бригады»[182]. Этот момент, этот день, этот поцелуй, этот несчастный случай абсолютно все меняют. После них жизнь уже никогда не будет прежней. Судьба героев – реагировать на события, адаптироваться к ним, приспосабливаться, меняться. Но герои в книге не главные. Главное – это событие, оно намного больше их самих.

Чаще мест и событий в заглавиях бестселлеров попадаются названия предметов. Обычно это существительные, иногда – с каким-то определением. Не просто «Слезы» – а «Слезы дракона». Не просто «Наследство» – а «Наследство рода Болейн»[183]. Не просто какой-то там абстрактный «Код» – а «Код да Винчи». В других случаях два существительных связаны между собой так, что у читателя мгновенно вспыхивает любопытство: «Воды слонам!»[184], «Стрекоза в янтаре»[185], «Воспоминания о полуночи»[186]. Почему слонам не хватило воды? Что особенного в этой стрекозе? Кто вспоминает о полуночи? Но, видимо, еще сильнее завлекают названия из одного существительного: «Щегол», «Фирма», «Сфера». Определенный артикль the гораздо чаще встречается в списках, чем неопределенный a. Разве название A Goldfinch звучит завлекательно? Нет. A Hit? Нет. A Lost Symbol? Нет[187].

Конкретность определенного артикля дает нам понять, что речь идет об определенном щегле, об этом щегле, который важен – достаточно важен, чтобы скреплять весь сюжет с символической, эмоциональной, структурной точек зрения на протяжении трех с лишним сотен страниц. Отсюда – The Gift, The Christmas Sweater, The Notebook[188]. Неопределенный артикль a работает лучше определенного the только для необычных случаев, когда существительному надо придать более общий, универсальный или метафорический смысл. Использование неопределенного артикля расширяет потенциал заглавия: A Spool of Blue Thread; A Thousand Splendid Suns; A Dog’s Purpose; A Game of Thrones[189].

Иногда автор решает обойтись вообще без артикля. Подобные заглавия предельно абстрактны, существительные в них использованы в переносном, метафорическом смысле: Beautiful Ruins; Bag of Bones; Beach Music; Freedom; Disclosure; Heart of the Matter[190]. Эффектно? Может быть. Но все же определенный артикль the остается самым удачным началом для заглавия бестселлера, поскольку означает, что где-то есть пружина действия – будь то точка на глобусе, конкретное событие, предмет или что-то еще. Такое заглавие дает нам определенное представление о том, что будет дальше.

В случае названий типа «Исчезнувшая» главный фокус и главное действующее лицо романа – обозначенный в названии персонаж. У каждого пятого бестселлера в нашей коллекции заглавие указывает на определенного героя. Впрочем, нам редко сообщают имя и фамилию героя полностью. Но такие романы есть. «Долорес Клейборн», «Оливия Киттеридж»[191], «Ганнибал», «Кросс»[192], «Скарпетта», «Зоя»[193]. Эти названия дают понять, что в книге рассматривается характер персонажа и мы пройдем по жизненному пути этого человека, чья личность заслуживает нашего пристального внимания на протяжении целого романа. Можно предположить, что мы узнаем об этом человеке достаточно много, чтобы составить его полный психологический портрет, и что извивы его души станут двигателем сюжета. Романы, названные именем главного героя, гораздо чаще встречались в те времена, когда этот жанр только возник и развивался, – в XVIII и XIX веках: «Памела»[194], «Молль Флендерс»[195], «Эмма»[196], «Госпожа Бовари»[197], «История Тома Джонса, найденыша»[198]. Сегодня, если мы видим имя в заглавии романа, оно, скорее всего, стоит в окружении других слов: «Защищая Джейкоба»[199], «Любя Фрэнка»[200], «Игра Джеральда»[201], «Убить Алекса Кросса»[202], «Навеки Элис»[203], «Ключ к Ребекке»[204]. Во всех случаях эти названия дают понять, что роман не просто описание характера персонажа. Его или ее имя сочетается с указанием на основной элемент сюжета, и все вместе до определенной степени описывает происходящие в романе события.

Однако в заглавиях с указанием персонажа гораздо чаще называется не имя, а роль или статус главного героя или героини. В нашей коллекции около сотни бестселлеров с названиями такого типа, и в большинстве из них упоминается роль – профессиональная или социокультурная. Иногда эти роли так важны, что не нуждаются ни в каких дополнениях. Читатель сам становится «Алхимиком», «Призраком»[205] или «Марсианином». Не каким-то алхимиком вообще, а вполне конкретным. Очевидно, что сюжет возникает благодаря такой необычной роли.

В других случаях роль вроде бы не так интересна: The Historian, The Piano Teacher, The Postmistress, The Client – «Историк», «Пианистка»[206], «Почтальонка»[207], «Клиент». Определенный артикль the выделяет эту пианистку и этого клиента среди многих, даже если они играют вполне заурядную роль. Определенный артикль придает персонажу потенциал. Мы ожидаем увидеть хорошо проработанный характер главной героини Айрис и узнать, как она справляется с отведенной ей ролью почтальонки. В этом будет заключаться определенный конфликт или ирония. В данном случае Айрис, одна почтальонка среди многих, приковала наше внимание тем, что поступила вразрез со своей ролью: она украла письмо вместо того, чтобы доставить его адресату. Поэтому она выделяется на общем фоне. Роман называется не A Postmistress[208], а The Postmistress[209]. Именно та разносящая почту женщина, которая совершила поступок, стала героиней сюжета. Таким образом, хорошо выбранное название романа должно отражать активную роль персонажа, и, следовательно, действие и драму всей книги – ее структуру, фокус, драйв, магнетизм. Поняв это, мы поймем также, чем вызвана мода на книги с девушками: дело не просто в том, что такие названия хорошо звучат. Это часть современной тенденции выдвигать на передний план и осмыслять жизнь женщин и их традиционные роли.

Что же до социокультурных ролей, в названиях популярно также слово «жена», но всегда – с уточнениями. Роман никогда не будет называться просто «Жена». Героине приходится столкнуться с чем-то бо?льшим. Заголовки бестселлеров о жизни женщины в браке выглядят примерно так: «Тихая жена»[210], «Парижская жена», «Верная жена»[211]. Прочитав название, мы начинаем гадать, какое отношение брак этой женщины имел к Парижу, почему жена молчалива, что означает ее верность. Мы также задумываемся о муже этой женщины. Как меняются открытые ей пути и возможные в ее жизни конфликты? Что представляет собой современная женщина в этой роли? Тот же самый вопрос (хоть и неявно сформулированный) возникает и при виде названий бестселлеров с «девушками». А вот слово «муж» в заглавиях нашей коллекции бестселлеров попадается один-единственный раз и сопровождается не прилагательным, как с женой (какая она?), а существительным. Мы не знаем, какой этот муж, но знаем, что у него есть – и оно наверняка ничего хорошего не сулит. «Тайна моего мужа». Ой-ой-ой. Тайна от жены? Готово, читатель попался на крючок. Достаточно беглого взгляда на список бестселлеров, чтобы понять: книги о проблемных браках сейчас притягивают читателя. По списку сразу видно, как интересна современным читателям роль женщины в семье, в браке и в обществе. Поэтому в заглавиях бестселлеров жен больше, чем мужей, а девушек – больше, чем юношей.

В нашей коллекции бестселлеров десять книг со словом «девушка» в названии. Но, прежде чем порекомендовать нашей издательнице покупать все подряд рукописи со словом «девушка», надо сначала понять, какие девушки привлекают читателей. Забавно, что правильной девушкой оказывается как раз «неправильная». Очевидно, что «Девушка, которая ждет тебя дома»[212] отличается от «Девушки, которая играла с огнем». Первая из этих двух книг не стала бестселлером даже после выпуска второго тиража, из которого, по данным Nielsen BookScan, на момент написания этой страницы разошлось ровно 117 экземпляров. А вторая, конечно, это знаменитый бестселлер Стига Ларссона. «Девушка, которая ждет тебя дома» – совсем не то же, что «Исчезнувшая девушка». Почему? Разумеется, потому, что пассивное сидение дома никого не привлекает – гораздо веселее играть, да не с чем попало – а с огнем! Что интереснее? Какой смысл быть девушкой, сидящей дома, когда можно стать той, которая исчезла? Скажем прямо: какой интерес быть «Девушкой на качелях»[213] (еще один небестселлер), если можно быть «Девушкой в поезде»? Первая далеко не уедет, а перед второй открыты определенные возможности. Разница между книгами из этих двух пар сказывается на разнице в оценках читателей – две звездочки из пяти или все пять. Девушка, способная пробиться в список бестселлеров, – необычная, новая героиня в массовой культуре. Она не милое, послушное дитя. У нее нет постоянного, отведенного ей места в жизни. Она в определенной степени изгой. Она полна гнева. Это своего рода литература нуар[214].

Конечно, здесь кроется некий парадокс. От героя или героини бестселлера мы ждем активных действий, двигающих сюжет, самостоятельности (социологи называют это качество агентивностью[215]) – характер персонажа должен завораживать читателей, быть достаточно необычным, чтобы удерживать их внимание. От главного героя мы ожидаем способности видеть не только светлые, но и темные стороны жизни, и при этом выживать. Но ведь слово «девушка» вызывает совершенно иные ассоциации. Это юное, невинное существо, зависимое от взрослых. Оно не управляет собственной судьбой. Оно нуждается в защите и воспитании. Однако девушки, которых мы видим в списке бестселлеров (строго говоря, девушками их назвать нельзя), вовсе не таковы и при этом сохраняют свое место в списке по многу недель. Главное здесь – их агентивность: она создает динамику сюжета, она формирует наше восприятие героини – и она же влияет на оценки читателей и рецензентов по всему миру.

Посеешь поступок – пожнешь характер

Уже несколько раз мы на страницах этой книги задавались вопросом – чего хотят читатели. Многие утверждают, что выбирают чтение по теме или по жанру. Вероятно, многие читают также и потому, что сюжеты с определенной структурой способны вызывать своего рода привыкание – сродни наркотическому. Но в рецензиях и в книжных клубах сотни тысяч читателей утверждают, что именно персонажи определяют разницу между просто хорошей книгой и такой, от которой невозможно оторваться. Через персонажей мы наблюдаем чужую жизнь, выносим суждения или погружаемся в фантазии. Очень многие читатели покупают романы именно ради этого. Герои книг уносят нас далеко, туда, где мы раньше не бывали – в географическом, эмоциональном, интеллектуальном, этическом, сексуальном смысле. Читатель как будто становится на место героя. И вот, пока он читает, у него злая мать – хотя на самом деле, в жизни, у него мать заботливая и любящая. Погрузившись в книгу, читатель может стать изменником или жертвой супружеской измены – хотя в жизни, скорее всего, не изменяет он и не изменяют ему. Читая, можно слетать на Луну, убить кого-нибудь или выйти замуж за Хитклиффа. Часть наслаждения от книги – мысленное слияние с героем или, наоборот, противопоставление себя ему, а иногда – то и другое одновременно. Мы видим, что бывает, когда человек идет на преступление, поддается соблазну, хранит верность или веру, принимает вызов. Герои книг заставляют нас о многом думать и пересматривать свои мнения. Они вносят новизну в нашу жизнь. У некоторых книжных персонажей есть целые клубы поклонников, которые пишут фанфики и носят футболки с изображением любимого героя. К примеру, во Флориде есть даже целый парк аттракционов и развлечений, посвященный Гарри Поттеру. Но многие писатели-беллетристы признают, что создание персонажей – самая трудная задача; этому нелегко научиться и трудно научить.

Сама концепция литературного персонажа окружена теоретическими противоречиями, многие из которых покажутся здравомыслящему читателю чепухой. Это – противоречие между несколькими разными постулатами. Первый и самая простой из них – персонаж, чтобы завоевать любовь читателей, должен обладать неповторимой и сложной индивидуальностью. Внешность и душа героя должны быть так хорошо описаны, чтобы читатель по-настоящему узнал его – лучше, чем своих друзей или даже себя самого. Иными словами, характеры персонажей в романе должны быть психологически глубоки и правдоподобны.

Другая концепция литературного персонажа состоит в том, что он должен играть одну определенную гендерную, социальную или культурную роль по отношению к другим возможным ролям. Следовательно, роль и поведение персонажа определяется тем, что это, например, бедная девочка-сиротка, а не богатый старый барон. И он, и она взаимно определяют друг друга – и определяются теми ролями, которые навязывают один другому. Получаются сюжеты типа «Красавица и чудовище» или «Леди и бродяга». В такой трактовке фигуры персонажа важна не столько его психология, сколько занимаемая им позиция и то, что мы через него узнаем о силах, действующих в пространстве произведения. Главные героини современных «книг про девушек» расшатывают устаревшие, стереотипные элементы системы. Мы чего-то ожидаем от героини, но наши ожидания не оправдываются – в итоге, во-первых, характер героини становится неоднозначным и сложным, а во-вторых, она сталкивается с внешними проблемами. Героини разные – и, соответственно, ведут себя по-разному. Ключ к пониманию удавшегося или неудавшегося автору персонажа – в его агентивности.

Герои с сильным характером всегда агентивны. Они обладают определенной энергией, мотивацией, драйвом. Что они делают со всем этим и какие препятствия встают у них на пути? Ответом на этот вопрос становится «роман характеров» – книга, сюжет которой построен на характерах героев. Но описать характер человека трудно. Выше мы заговорили о теоретических противоречиях, чтобы продемонстрировать разногласия среди литературных критиков и авторов: они никак не могут прийти к единому мнению о том, как создаются персонажи и каким образом следует их создавать. Об этом приходится помнить при разработке компьютерной модели, анализирующей героев книги.

У хороших писателей в запасе есть разные приемы и методы. Некоторые авторы полагаются на описания. Допустим, мы хотим вывести нашу издательницу в книге (впрочем, так оно и есть: ведь это она начала разговор про девушек). Пусть наш роман называется «Девушка с шестнадцатого этажа» и начинается так:

Даниэла сидела в своем офисе на шестнадцатом этаже небоскреба «Утюг» в Нью-Йорке, среди гор книг и рукописей. Свет из окна отражался в ее блестящих каштановых волосах средней длины. На ней была элегантная строгая белая блузка на пуговицах.

И так далее.

Пока что мы знаем Даниэлу только по окружающим ее вещам. Надетая на ней блузка дает определенную информацию. Здание, в котором сидит Даниэла, – тоже. Некоторые авторы создают характеры героев с помощью подобных описаний. Другие пользуются диалогами. Например, мы многое бы узнали, если бы в этот момент пришла ассистентка Даниэлы и сказала: «Мадам, вы не возражаете, если я сделаю перерыв на четыре-пять минут, чтобы позвонить своей больной матери?» Равным образом мы многое поняли бы о Даниэле, если бы ассистентка сказала следующее: «Эй, босс, я выскочу ненадолго, мне нужно проведать маму». Два диалога создают разное впечатление о характере героини.

Еще один прием – несобственно-прямая речь, когда повествователь как бы залезает в голову персонажа. Некоторые писатели постоянно им пользуются (например, его виртуозно применяла Джейн Остин), некоторые – активно не одобряют. В нашей книге о девушке несобственно-прямая речь могла бы выглядеть, например, так: «Даниэла подняла взгляд на ассистентку. Когда она наконец перестанет разглагольствовать про свою дурацкую мать и найдет новую рукопись про девушку?» Рассказчик как бы украл мысли Даниэлы и поделился с нами. Мы узнали про Даниэлу еще немного.

С точки зрения литературоведа, анализирующего текст, тут важно заметить, что сама Даниэла до сих пор бездействовала. Она статична, пассивна, она – объект рассмотрения. Она оживет по-настоящему и станет кем-то в глазах читателей, лишь начав действовать – читать, двигаться, говорить, отвечать, хмуриться или улыбаться. Когда будет что-то делать. Действуя, Даниэла продвигает сюжет вперед. Ее поступки один за другим определяют его траекторию, изгибы его графика. Действия Даниэлы позволяют создать сюжет с привлекательной формой графика, подобный тем, что мы рассматривали в 3-й главе. Следовательно, наша концепция персонажа (одна из многих возможных) заключается в том, что персонаж должен действовать – в этих действиях выражается его агентивность. А действия автор может адекватно описать только глаголами. «Даниэла была счастлива», «Даниэла смеялась» и «Даниэла сияла» – все это характеризует героиню по-разному. Ключ к пониманию – глаголы. В «Коде да Винчи» Лэнгдон боится замкнутых пространств. В «Ультиматуме Борна»[216] Джейсон Борн убивает людей. В «Исчезнувшей» Эми планирует сложную месть мужу, Нику, который ей изменял. Борг из «Звездного пути»[217] ассимилирует другие существа. Очевидно, у персонажей есть разнообразные определяющие их характеристики – такие как внешность, пол, цвет кожи и так далее, но, не увидев персонажа в действии, мы не узнаем его по-настоящему. В своем исследовании мы решили проверить, существуют ли такие действия, такие глаголы, которые способствуют продажам лучше других? Точнее, мы хотели узнать, существуют ли в области действий и агентивности персонажей (и мужчин, и женщин) закономерности, делающие книгу бестселлером. Мы выяснили, что ответ на этот вопрос – «да», причем для персонажей обоих полов.

Сделай же что-нибудь!

Компьютерный анализ текста в отношении персонажей – непростая задача. Из 2-й главы видно, что темы несложно извлечь из текста, потому что они обозначаются существительными, а существительные легко обнаружить. Но поскольку персонажи в романах описываются разными способами, их компьютеру гораздо труднее анализировать. Еще труднее компьютеру понять, кто что делает. Самая очевидная сложность заключается в том, что автор не всегда зовет персонажа по имени. В «Пятидесяти оттенках серого» рассказ идет от первого лица и героиня чаще всего называет себя «я», а не «Анастасия» или «мизз Стил», как обращается к ней Кристиан. В книгах про девушку с татуировкой дракона Лисбет Саландер иногда обозначается как «Лисбет», иногда – как «Саландер», иногда – «она», «ее» или «ей». Вполне возможно, что героиню по имени Лисбет в разных местах романа будут называть «Лиз», «Бет» и даже «Бетти». Это большая проблема для исследователей[218]. Вторая сложность – местоимения. В романах всегда много персонажей, и не так просто понять, к кому относится каждое из многочисленных «он», «она», «они». Например, в «Исчезнувшей» нужно как-то отличать, когда слово «она» обозначает главную героиню, Эми, а когда – Бони, сотрудницу полиции. Для людей это вполне очевидно из контекста, в котором появляется каждая «она», компьютерам же такой анализ дается гораздо труднее[219].

Оказалось, что об агентивности персонажа можно многое узнать, если научить компьютер находить имена персонажей и относящиеся к ним местоимения, а затем собирать глаголы, связанные с этими именами и местоимениями. Используя данные о том, что делают персонажи в романе – например Даниэла стоит или читает, – мы смогли предсказать, будет ли книга из нашего корпуса текстов бестселлером, с точностью 72 %. И это лишь на основании базовых глаголов, единственной точки данных, полученной бестселлерометром и взятой отдельно от других данных. На основе этой информации мы смогли понять, что именно делают герои бестселлеров, в отличие от героев менее успешных книг. Оказалось, что самые обычные глаголы очень важны.

Персонажи бестселлеров, независимо от пола, в чем-то нуждаются и выражают эту свою потребность. Они чего-то хотят, и мы узнаем, чего именно. Глаголы need[220] и want[221] – два самых значительных маркера разницы между бестселлерами и небестселлерами. Удивительно, что в описаниях персонажей небестселлеров заметно реже уделяется внимание их желаниям и потребностям. Мир романа-бестселлера – это мир, в котором люди знают о своей агентивности, контролируют ее и пользуются ею. Их глаголы выражают четкость и уверенность в действиях. Персонажи бестселлеров гораздо чаще хватают и делают, думают и спрашивают, смотрят и держат. Они чаще любят. Они осознают свои действия и знают самих себя. Они трезво оценивают свой характер со всеми достоинствами и недостатками, хотя и могут быть от него не в восторге. Они активно «живут свою жизнь», если можно так выразиться, и заставляют события совершаться. Персонаж бестселлера – независимо от того, мужчина это или женщина, – рассказывает, видит, слышит и достает. Ему или ей многое нравится. Это человек, обладающий энергией. Такой герой – или героиня – толкает и тянет, начинает, работает, знает и в конце концов прибывает к цели. Персонажи, населяющие бестселлеры из списка NYT, обычно действуют целенаправленно, умело и уверенно. В романах, не попавших в список бестселлеров, все эти глаголы встречаются реже.

Сравним такого, уверенного в себе, персонажа с другим – с тем, который редко делает что-то из перечисленного выше. Наш компьютер сообщает: второй персонаж реже нуждается, хочет, делает, рассказывает или прибывает. Вместо этого он гораздо чаще запинается и роняет. Он менее привлекателен для читателей: им, судя по всему, не хочется тратить время на героя, который требует, кажется, ждет и перебивает. Читатели хотят, чтобы персонаж был, а не казался. Чтобы он делал, а не ждал. Они хотят видеть человека, уверенного в себе и умеющего себя держать, а не такого, который требует и перебивает. Персонажи менее успешных книг – мужчины и женщины – слишком часто орут, швыряют, резко поворачиваются и пихают. Это очень утомительно! Такие персонажи склонны бормотать, протестовать и колебаться. Читатели закатывают глаза: взрослый человек ведет себя не лучше капризного ребенка. Пословица «Кто колеблется, тот уже проиграл» правдива и применительно к литературным персонажам любого пола. Ради неуверенного в себе героя или героини читатель не станет лихорадочно переворачивать страницы. Если же герой агентивен, но при этом слишком часто запинается, роняет или колеблется, с ним каши не сваришь.

Анализ, впрочем, показал некоторую разницу между мужскими и женскими ролями в бестселлерах. И мужчины, и женщины действуют, что-то делают. Но в их действиях есть разница – она вновь и вновь проявляется в романах, попавших в список. И мужчины, и женщины в бестселлерах тратят, шагают и молятся чаще, чем персонажи менее успешных романов. Но мужчины чаще целуют, в то время как женщины чаще обнимают. Мужчины летят, водят (транспортное средство) и убивают чаще женщин. Женщины говорят, читают и воображают чаще мужчин. Он путешествует; она остается. Он исходит из предположения; она решает. Он обещает; она верит. Оба любят – любовь в бестселлерах вовсе не чисто женское занятие, – но женщина более склонна ненавидеть. Оба смотрят, но он пялится. Часто – на нее. Она кричит и отталкивает. Он беспокоится и бьет. В бестселлерах из списка проявляются традиционные, даже стереотипные, гендерные роли, но помимо них у мужчин и женщин в этих книгах есть много общего, и именно это общее помогает многое понять о том, как устроена литература, имеющая успех у читателя.

Проанализировав нашу коллекцию на предмет глаголов, передающих душевное и эмоциональное состояние героев, мы обнаружили, что в бестселлерах диапазон экзистенциального опыта гораздо шире. Двадцать два таких глагола в бестселлерах встречаются гораздо чаще, чем в обычных романах (мы нашли лишь восемь). Четыре основных глагола этой категории для бестселлеров – это need, want, miss и love[222]. Всевозможные переходы между этими словами образуют сюжеты многих классических романов и самых популярных бестселлеров. В среднем персонажи таких книг хотят чего-то или кого-то и нуждаются в ком-то или в чем-то вдвое чаще, чем в небестселлерах, а скучают по кому-то и любят кого-то примерно в 1,5 раза чаще.

Душевное и эмоциональное состояние героев в книгах, которые бестселлерами не стали, точнее всего будет назвать пассивным. Характерные для них глаголы наводят на мысль о том, что эти люди – жертвы обстоятельств. Не они изменяют мир вокруг себя, а мир изменяет их. Это также люди менее открытые и отчасти более негативно настроенные. Они смиряются, испытывают неприязнь, кажутся, строят предположения и приходят в себя. Еще они желают[223] – это более пассивный и менее уверенный в себе вариант глаголов «хотеть» и «нуждаться». В среднем персонажи небестселлеров желают в 1,3 раза чаще, строят предположения в 1,6 раза чаще и испытывают неприязнь почти вдвое чаще, чем персонажи бестселлеров.

Рассмотрев глаголы, обозначающие физические действия, мы получили ничуть не более лестный портрет персонажа небестселлера. Мы решили, что он сам виноват – не только в своей неудачной судьбе, но и в неуспехе книги на рынке. Известная пословица гласит: посеешь поступок – пожнешь привычку, посеешь привычку – пожнешь характер, посеешь характер – пожнешь судьбу. Представьте же себе, какая судьба ждет персонажа, который бурчит, цепляется, сверлит взглядом, сглатывает, краснеет, дрожит и липнет. Он ни в какой культуре не потянет на роль архетипического героя. Может, его отравили? Или у нее сердечный приступ? А если персонаж к тому же дергается, дрожит, вырывается, возится и швыряет? Такой, пожалуй, способен заблудиться в трех соснах. С такими персонажами бестселлера не создашь.

Герои, контролирующие свое тело и совершающие простые действия, несравненно более привлекательны. Персонажи бестселлеров едят, кивают, открывают, закрывают, говорят, спят, печатают, наблюдают, поворачиваются, бегут, стреляют, целуют и умирают. Кстати сказать, мужчины и женщины в бестселлерах умирают и выживают с одинаковой частотой, хотя это не обязательно главные герои. Тут важно заметить, что в бестселлерах персонажи гораздо чаще предаются драматическим занятиям вроде умирания и выживания, в отличие от героев менее успешных книг, которые предпочитают зевать.

Большинство героев бестселлеров обладает некой магнетической притягательностью, выделяющей их из толпы. Они одарены способностями, позволяющими им делать то, что не под силу другим. Митч Макдир в «Фирме» – красавец, выпускник Гарварда, трудоголик, умеет мыслить четко и ясно и не нуждается в сне. Он способен перехитрить и мафию, и ФБР, причем одновременно. Или возьмем Сюзи Сэлмон из романа «Милые кости»[224]. Она мертва. Но в то же время продолжает жить. Она на небесах, откуда ей все видно, и наблюдает за расследованием своего убийства. Она даже смогла вселиться на время в чужое тело, чтобы единственный раз поцеловаться с мальчиком, в которого была влюблена при жизни. Роберт Лэнгдон тоже не просто рассеянный профессор в твидовом пиджаке. Чтобы расшифровать код да Винчи, мало прочитать две-три библиотечные книги и выпить чашку чаю: Лэнгдон – лучший в мире специалист по символогии, у него проницательный и быстрый ум. Эми Данн из «Исчезнувшей», конечно, носительница поведенческого типа А[225], и это довело ее до убийства, но мы не можем не видеть, что она гениальная лгунья и мастерски разработала невероятно коварный план; она обводит вокруг пальца всех окружающих так, что у читателя волосы встают дыбом. Лисбет Саландер – высококвалифицированный хакер, без нее все тайны трилогии «Девушка с татуировкой дракона» так и остались бы неразгаданными. Никто не умеет взламывать чужой код так, как она. Все это верно и для бестселлеров, получивших Пулитцеровскую премию. В романе «Весь невидимый нам свет» юный Вернер использует свои познания в электронике, чтобы вырваться из сиротского приюта, а Мари-Лора, несмотря на слепоту, совершает героические поступки. Что общего у этих и многих других персонажей бестселлеров? Никто из них не желает, не предполагает и не зевает. Они – особенные люди. Они храбры и уверены в себе. И читатели их поддерживают.


Персонажи бестселлеров не только совершают правильные поступки правильным образом, но и разговаривают правильно. Анализ диалогов позволил нам понять, что читателям не понравится героиня, которая уверяет, произносит, соглашается, восклицает, бормочет, отвечает, протестует, обращается, кричит или требует. Здесь можно не слишком удачно пошутить насчет женщин вообще («Эта женщина слишком щедра на уверения»[226], например), но на самом деле речь идет об эффективности изображения характеров. Почему же среди бестселлеров мало таких, где женщины кричат и требуют? Дело не в том, как это соотносится с принятыми в нашей культуре видами поведения женщин. Просто если писатель начинает использовать затейливые синонимы вместо обычного «сказала», это верная дорога в ад. Исключение составляет «спросила», поскольку это слово указывает на вопрос. Любой, кто хоть раз заглядывал в учебник по писательскому мастерству, ходил на уроки литературы в старших классах или просто читал книги талантливых и успешных авторов, знает, что не следует нанизывать длинные цепочки наречий и прилагательных – это все равно, что поставить широкие шины и светодиски на винтажный «ягуар». Аналогичным образом читатели должны понимать, как именно говорит персонаж, из контекста, а не за счет режущих глаз, неестественных, лишних глаголов, которые только отвлекают внимание от настоящего действия. Сравните два отрывка. Первый:

В половине восьмого вечера Даниэла по-прежнему сидела за рабочим столом. Уходя, ассистент сообщил, что ей еще нужно ответить на четыре звонка, утвердить обложку и просмотреть три рукописи. «Я тебя тоже очень люблю», – сказала Даниэла.

И второй:

В половине восьмого вечера в кабинет Даниэлы вошел ассистент.

– Вам еще нужно ответить на четыре звонка, утвердить обложку и просмотреть три рукописи! – воскликнул он.

– Я тебя тоже очень люблю, – провозгласила Даниэла.

Ну как? Реплики героев в обоих случаях одни и те же, но во втором варианте нет никакого смысла, поскольку слова, сопровождающие речь героев, полностью сбивают верный тон. В первом варианте мы улавливаем сарказм; во втором нам только и остается заключить, что Даниэла бредит. Но подавляющее большинство неумелых писателей чрезмерно увлекается глаголами, описывающими речь.

Наша компьютерная модель в данном случае солидарна со школьными и университетскими преподавателями. Описательные глаголы при прямой речи должны быть почти незаметны для читательского слуха, непримечательны, как скромное «сказала». Характеризовать героев нужно через их реплики и контекст, а не через отвлекающие глаголы, расположенные вне реплик. Именно поэтому «спросила» и «сказала» – глаголы, характерные для бестселлеров, а «потребовала» и «воскликнула» – нет.

Героиня нуар

Почему need – основной глагол, помогающий отличить бестселлеры от небестселлеров? И почему в книгах, которые хуже продаются, его заменяет глагол wish? Статистические данные недвусмысленно демонстрируют эту разницу. Ну что ж, подумали мы: «Я мыслю – значит, я существую». Я желаю – следовательно, я сижу на месте и жду, пока что-нибудь случится. Я нуждаюсь в чем-то – следовательно, действую. Действие – двигатель сюжета. Персонаж, испытывающий потребность в чем-то, должен что-то сделать, отправиться в путешествие, взаимодействовать с людьми, возможно – вступить в конфликт. То, в чем нуждаются персонажи, и то, как они эти потребности удовлетворяют, помогает нам понять их характеры.

Что же до многочисленных девушек, бестселлерометр сообщил нам, что «новые девушки», ворвавшиеся в списки бестселлеров, отнюдь не пассивны. Наоборот. Они в чем-то нуждаются. Они хотят. И действуют, чтобы удовлетворить свои нужды и потребности. В «Девушке с татуировкой дракона», «Исчезнувшей» и «Девушке в поезде» с глаголами все в полном порядке. А индексы, вычисленные нашей моделью, показывают: именно девушки, а не мужские персонажи романа определяют его успех. Не из-за Лисбет ли трилогия Стига Ларссона разошлась таким огромным тиражом? Если верить нашей модели, то именно из-за нее. Дело не в детективном сюжете. Не в «экзотическом» месте действия (Швеция). Не в откровенных описаниях сцен насилия. Дело в Лисбет. И она, несомненно, задала тон. Можно с уверенностью сказать, что в моду вошел определенный тип женского персонажа – с неоднозначным характером, темными сторонами души, чего никогда не встретишь, например, у героинь Дебби Макомбер.

Как это доказать? Чем подкрепить мнение некоторых критиков, объясняющих успех трилогии Стига Ларссона тем, что это «романы характеров», а не триллеры и не жанровая проза? В каждом романе мы проанализировали глаголы, управляемые местоимением первого лица «я», а также местоимениями женского и мужского рода. Мы подсчитали вероятность того, что трилогия стала бы бестселлером, на основании глаголов, относящихся только к персонажам-мужчинам. Вероятность оказалась равной 29 %. Значит, вовсе не фигура Микаэля Бломквиста определила успех. Наша модель решила, что читателю он не запомнится, – и правда, мы сами прочитали «Девушку», когда она вышла, а потом обнаружили, что благополучно забыли о существовании Бломквиста. Но Лисбет мы не забыли. Рассмотрев другие «книги с девушками», мы нашли в них то же явление, но не столь четко выраженное. Вероятность «Исчезнувшей» стать бестселлером только на основе мужских персонажей оказалась равной 72 %, а «Девушки в поезде» – 97 %. Такой высокий показатель означает, что герои Полы Хокинс все делают правильно. Но следует учесть, что в этом романе персонажей-мужчин гораздо меньше, чем в двух других, а значит, у них просто меньше возможностей продемонстрировать неправильные действия. Агентивность героинь в «Девушке с татуировкой дракона» получила оценку 93 %, а в «Исчезнувшей» и «Девушке в поезде» – 99 %. То есть наша модель доказала, что да, в этих девушках действительно что-то есть.

Результаты кажутся неожиданными – ведь героини этих книг разительно отличаются от традиционного идеала женщины. Мы очень далеко ушли от подчеркнуто женственных, красивых, самоотверженных и сострадательных героинь Даниэлы Стил. Но посмотрите, как девушки с непростым характером взяли штурмом списки международных бестселлеров! Вероятно, это показывает, что в нашей культуре существует некий вакуум – жажда новых приключений, побега от существующего порядка, расшатывания устоев. Конечно, социологам найдется что сказать по этому поводу; наша дисциплина, литературоведение, может лишь констатировать факт: на свет родился новый поджанр. Его окрестили «домашним нуаром», и в нем правит бал героиня нового типа, та самая девушка. Она играет важную роль, поскольку именно она приносит традиционные элементы детектива, триллера и даже хоррора в сферу частной жизни. Мрачные дела, характерные для этого жанра, обычно творились вне дома – среди шпионов и правительственных агентов, в залах суда и тюрьмах, школах и офисах. В книгах жанра «домашний нуар» девушка вводит нас в круг дома и семьи, которые традиционно являются ее территорией. Она показывает нам отношения, брак, семью – и переворачивает все стереотипы с ног на голову. Новая героиня выступает в роли карающего ангела, разгневанной жертвы или яростного разрушителя.

В каком-то смысле задача этой девушки – очищение. Она пришла испытать на прочность, разрушить и уничтожить установки, ограничения, ожидания, налагаемые обществом на женщину. Новая девушка – лишь один из многочисленных исполнителей «очистительных работ», проводимых тысячами персонажей бестселлеров в разных жанрах. Многие героини и герои книг – такие агенты перемен, они преобразуют мир внутри своего романа (обычно – преодолевая чье-нибудь сопротивление). Наблюдая за их работой, читатель испытывает наслаждение, граничащее с катарсисом. Культуролог-антрополог Мэри Дуглас предлагает нам удачную метафору. В своей работе о системах и аномалиях систем она подмечает весьма человеческое желание – называть вещи и явления таким образом, чтобы это позволило называющему (человеку или группе людей) отреагировать на названное определенным образом. Например, в системе, где общепринятой нормой является моногамия, мы назовем человека «свингером», чтобы не осуждать его выбор – иметь более одного полового партнера. Правительство, которое видит в неких людях угрозу, может назвать этих потенциально угрожающих ему людей «террористами», чтобы оправдать атаку на них с помощью дронов. Названия очень важны в определении того, что для нас приемлемо и неприемлемо. Это верно для чего угодно – от заглавий романов до личных и политических решений. Это – ключевой момент и для художественной литературы.

Для Мэри Дуглас выбор подходящего имени – часть борьбы с угрозой, названной или безымянной. В здоровой системе «проблемой» может оказаться буквальное или метафорическое загрязнение, угроза, нарушение какого-нибудь табу. Это также может быть неоднозначная новая идея, новая прогрессивная схема поведения – или неизвестный убийца, держащий в страхе маленький американский городок. Конечно, в любом литературном сюжете есть своя «проблема» – даже если этот сюжет стар как мир (например злая мачеха, мешающая красавице выйти замуж за принца). «Новые девушки» – героини бестселлеров интересны среди прочего и потому, что ставят под вопрос истинность такого подхода. Дуглас утверждает, что никакой человек или явление само по себе не является проблемой или «грязью», но к нему относятся как к таковому, если он/оно не укладывается в окружающую его культурную систему. Лисбет Саландер с ее «ирокезом» и татуировками вроде бы не представляет собой ничего особенного – но лишь до тех пор, пока мы не сравним ее с нормой, то есть со стандартами описанного в романе шведского общества и с другими литературными героинями. Лисбет интересна потому, что она одновременно воспринимается как проблема и является решением. То же можно сказать о Рэйчел, «Девушке в поезде», и Эми, «Исчезнувшей». Все трое – часть намного более сложного и завораживающего сюжета, нежели стандартная и стереотипная «борьба добра со злом». Эти девушки каким-то образом совмещают в себе все: плохое и хорошее, проблему и решение. Что нам делать с темной стороной женственности, с девушкой, создающей проблемы?

Давайте обратимся к главному бестселлеру нынешнего поколения. Без его упоминания не может обойтись ни одна книга о бестселлерах. «Гарри Поттер». В этой серии романов загрязнение системы, обитающее в ней зло даже окрестили «Тот-кого-нельзя-называть». Так он и существует, неназываемый. Это самый буквальный литературный пример того, о чем пишет Дуглас. Лишь сам Гарри осмеливается назвать «грязь» настоящим именем – лорд Волан-де-Морт. Остальные персонажи серии, услышав это, пугаются и шикают на него. И конечно, именно Гарри – и только ему одному – хватает сил, чтобы сразиться с Волан-де-Мортом и наконец изгнать его из системы – не только из Хогвартса, но и из всего маггловского (то есть не волшебного) мира. Воцаряются порядок и безопасность, и дело непременно кончается свадьбой. В эпилоге мы видим, что все добрые волшебники и волшебницы переженились, и побившая все рекорды семитомная серия книг заканчивается фразой: «Все было хорошо». Это удовлетворение – ощущение, что все кончилось хорошо, – так часто встречается в сюжетах бестселлеров, что явно отражает культурную – если не глобальную психологическую – потребность читателей.

Концовка типа «все было хорошо» кажется необходимой для сюжета – неотъемлемым элементом трехчастной структуры. Разумеется, к счастливому финалу удается прийти не всегда, но, по-видимому, сюжет обычно движется вперед, пока не наступит ощущение завершенности – чувство, что теперь можно остановиться. Персонажи так или иначе продвигают сюжет к этой точке, и в процессе их характеры раскрываются и обогащаются. В начале первой книги Гарри – одиночка, изгой, мальчик с зигзагообразным шрамом на лбу, живущий в чулане под лестницей. Он вступает в подростковый возраст, и вдруг выясняется, что он – избранный. У него обнаруживаются способности к магии, и он целыми днями заставляет вещи исчезать и снова появляться, сражается с псами-оборотнями и растениями-людоедами, проклятиями и «пожирателями смерти», высасывающими душу из своих жертв, побеждает в чрезвычайно популярном в Хогвартсе командном виде спорта (нечто вроде лакросса на метлах) и даже воскресает из мертвых. После всех этих драматических событий, доказав нам, что он – особенный, Гарри вдруг находит покой в довольно традиционном (по любым меркам) образе жизни среднего класса. Герой десятилетия завершает свои подвиги предложением руки и сердца доброй, симпатичной и настроенной на семью девушке, сестре своего лучшего друга. На последних страницах саги мы видим, что самый сильный и смелый добрый волшебник в современной литературе поселился с женой в пригороде, нарожал с ней и воспитывает кучу детей, питается домашней едой и каждый день читает газету. Система Хогвартса очищена от «грязи»; в отсутствие грозного противника Гарри, кажется, больше не испытывает потребности совершать подвиги. Сюжет выдыхается и не может двигаться дальше. Достигнута точка неподвижности. Все хорошо.

Очень многие бестселлеры укладываются в эту схему. В конце трилогии «Пятьдесят оттенков» мастер «секса с вывертами», неспособный на прочные отношения, весело проводит время с женой и детьми на залитой солнцем лужайке. В финале «Кода да Винчи» угроза со стороны организации «Опус Деи» ликвидирована, и после всех перипетий сюжета Роберт и Софи неожиданно встречают родственников Софи, потомков Иисуса Христа. Книга кончается воссоединением Софи с семьей и прозрачным намеком на романтические отношения между Софи и Лэнгдоном. Все хорошо. Подобную концовку можно найти практически в любом бестселлере из списка – это не всегда хеппи-энд, но ощущение завершенности, покоя должно присутствовать непременно. Так, по-видимому, записано в негласном контракте, удовлетворяющем читателя.

Однако некоторым героям романа такой конец не светит. Например, девушкам, ведь они представляют собой и проблему, и решение проблемы в одном лице. Они угрожают традиционным моральным устоям системы, да еще в попытках очистить мир вокруг себя обличают чужую греховность. Они – агенты перемен, одновременно могучие и скованные. Именно поэтому их называют «девушки» – таким образом автор указывает на то, что их агентивность ограничена. Мы можем предсказать, что, пока писатели не найдут решение, подходящее место для этой возмутительницы спокойствия, она снова и снова будет появляться в списках бестселлеров.

Вынем кролика из шляпы

Мы уже упоминали, что need – самый полезный в нашей модели глагол для выявления бестселлеров. Потребности персонажа описывают его характер. Возьмем для примера «Исчезнувшую». Если извлечь все места, в которых герои говорят о своих потребностях и нуждах, получится отличная выжимка из романа, передающая сюжет и тон книги в 163 предложениях. Она дает идеально точный портрет семейной жизни Эми и Ника. Читая эту выжимку, чувствуешь, как нарастает напряжение между супругами. Ник говорит: «Мне нужно выпить». Эми говорит: «Мне нужно, чтобы меня подстерегали в засаде и ловили врасплох, чтобы мужчина был этаким любвеобильным хищником». Ник говорит: «У меня нет потребности объяснять ей свои действия». Эми говорит: «Я очень плохая девочка, меня нужно наказать». Ник говорит о своей жене: «У нее была потребность ослеплять мужчин и возбуждать ревность в женщинах». И так далее. Ник и Эми презирают друг друга, и это создает эмоциональное напряжение в книге и показывает нам темную сторону их брака. Вообще все нужды и потребности героев указывают на эмоциональную и психологическую изнанку несчастливой семьи. Кульминация достигается в тот момент, когда Ник осознает, что его жена в самом деле опасна, и говорит: «Мне нужна была поддержка других людей – подтверждение, что моя жена не изумительная Эми, а мстительная Эми».

Про три «романа о девушках» можно еще написать очень многое, и они заслуживают монографии, посвященной только им. Фигура отрицательной героини в массовой культуре, пожалуй, тянет на тему для диссертации. Но в рамках нашей книги мы только скажем, что компьютерная модель помогла выявить три аспекта этих романов, которые могут помочь в объяснении их успеха. Первый – агентивность персонажей (особенно – героинь). Второй относится к сюжету – то, что мы назвали кривыми, привлекательными для читателей. Третий – тематика, и особенно – центральная тема человеческой близости, которую мы обсуждаем во 2-й главе. В трех «романах про девушек» эти элементы сплетены в идеальной пропорции – и по тиражам видно, что авторы попали в цель. Сейчас, когда мы это пишем, только в США продано 7 866 590 экземпляров «Исчезнувшей», 7 460 616 – «Девушки с татуировкой дракона» и 3 731 239 – «Девушки в поезде», которая даже не успела еще выйти в мягкой обложке. Книги нечасто достигают подобных тиражей, но наши алгоритмы объяснили еще кое-какие детали этого успеха.

Вспомните, что романы из нашего корпуса текстов имеют определенный вид сюжета. На самом базовом уровне можно выявить шесть или семь фундаментальных форм сюжетного графика. Некоторые из них напоминают букву М, некоторые – W, есть похожие на наклонную N или большую U. Изучая базовые виды сюжетов всех книг из нашего корпуса, мы не нашли какого-то одного сюжета, который гарантировал бы успех на рынке. Но оказалось, что книги определенного типа с характерными для них персонажами неизменно привлекают читателей. Поэтому, обнаружив, что у трех «романов про девушек» сюжетные графики поразительно похожи, мы поняли: это не случайно. Наш интерес к этим романам начался с несерьезной беседы о моде на книги про девушек. Мы задались вопросом: это случайное совпадение или в них что-то есть? Наша модель исследовала агентивность персонажей и подтвердила: в них действительно что-то есть. Но окончательную точку поставил компьютерный анализ сюжета. Он показал, что «романы про девушек» – вовсе не изолированные примеры книг, в которых автору случайно удалось описание нехороших девочек. Их в самом деле можно отнести к одной группе – к зарождающемуся поджанру. См. рис. 16.


Рис. 16


Эти три сюжетных графика говорят сами за себя. Лисбет, Эми и Рэйчел провоцируют возникновение сюжетов, практически одинаковых по форме, и эти сюжеты не приводят читателя к традиционной счастливой концовке. Ясно видно, что в конце книги нам не предложат сценарий по типу «Гарри Поттера», в котором «все было хорошо». Перед нами – фигура девушки, не имеющей своего места в жизни, и мы считаем, что, пока авторы не найдут ей места, не «пристроят» ее, не разрешат ее конфликт, эти книги не выйдут из моды.

В графике интересны два момента: резкое падение вначале, когда героиня сразу попадает в беду, а потом – отсутствие подъема в конце. Отчетливо видно, что это одна из особенностей нового поджанра – в конце книги персонажи еще менее счастливы, чем были в начале.

Концовки этих романов тоже нетрадиционны. В «Девушке с татуировкой дракона» Лисбет понимает, что ее чувство к Бломквисту – любовь и что между ними могут завязаться отношения. Такой сюжетный ход использован в тысячах книг – мужчина и женщина вместе спасают мир и в процессе влюбляются друг в друга. Но Лисбет, привыкшая брать быка за рога, действует – идет и покупает Бломквисту особенный подарок, который он обязательно оценит. Когда он примет подарок и вступит в отношения с Лисбет, перейдет ли она из разряда девушек в разряд женщин? Не это ли ее шанс найти свое место в мире? Читатели начинают надеяться. Лисбет идет с подарком к дому Бломквиста, но случайно видит его на улице – он выходит из кафе под руку с любовницей. Кстати говоря, его любовница замужем, в открытом браке. Заметим, что в этом романе вообще нет типичных закрытых, моногамных браков: все «романы про девушек» испытывают на прочность стереотипные традиционные отношения. Книга кончается тем, что Лисбет отказывается от своих мечтаний:

– Саландер, ты жалкая идиотка, – сказала она вслух самой себе.

Она развернулась и пошла домой, в свою только что убранную квартиру. Когда она проходила мимо квартала Цинкенсдамм, повалил снег. Элвиса она швырнула в мусорный контейнер[227].

В квартире у Лисбет идеальный порядок, да и ее саму запорошил очистительный снег. Этот переворот в душе, этот снег – почти джойсовская деталь[228]. Катарсис. Лисбет завершила свою работу по избавлению общества от негодяев, но самой ей в этом обществе места не нашлось.

В конце «Девушки в поезде» Рэйчел не воссоединяется с бывшим мужем, как надеялась сначала, и не вступает в отношения с мужем Меган, хотя и переспала с ним. Вместо этого Рэйчел осознает, что ее бывший муж Том – убийца, именно он убил пропавшую Меган, которую Рэйчел впервые увидела из окна поезда. Рэйчел также понимает, что ее бывший муж (уже успевший жениться на другой) был любовником Меган, чью семейную жизнь Рэйчел домысливала как идеальную, наблюдая за домом Меган из окна поезда. Все смешалось! Это никак нельзя назвать любовным романом с хорошим концом. Защищаясь, Рэйчел в присутствии новой жены Тома убивает его штопором. Весьма ироничный выбор орудия – если учесть, что Рэйчел пьет. То, что Рэйчел убирает «грязь» из системы с помощью именно этого предмета, кажется уместным. Бывший муж, он же убийца, сфабриковал себе алиби благодаря алкоголизму Рэйчел, внушив ей, что она спьяну все забыла. Штопор (поначалу – символ порока отрицательной героини) становится символом восстановления справедливости.

Как и в «Девушке с татуировкой дракона», в конце концов заявленная в названии девушка помогла раскрыть преступление, но не обрела ни мира в душе, ни ощущения принадлежности к чему-то. Она готовится к дальнейшей жизни – опять на поезде и опять одна:

Я ложусь на кровать и выключаю свет. Знаю, что не усну, но все равно буду пытаться. Надеюсь, рано или поздно эти кошмары перестанут меня мучить, но сегодня я уверена, что впереди меня ждет долгая ночь. А утром мне надо встать рано, чтобы успеть на поезд[229].

Из трех сюжетных графиков у «Исчезнувшей» – самая пологая (и, видимо, самая безрадостная) концовка. Здесь наша модель не ошиблась. К концу книги Эми и Ник намертво застряли в чудовищной пародии на брак. Эми совершила убийство, вернулась к мужу, подкупила и запугала его и даже оплодотворила себя взятой у мужа без его ведома спермой. Эми сделала все, чтобы создать видимость благополучной семьи, хотя на самом деле это лишь маска, прикрывающая черную бездну. Роман кончается тем, что Эми одерживает верх и тем самым захлопывает капкан, который будет держать вместе ее и Ника до конца жизни. Этот финал ужасен, но от книги невозможно оторваться.

Итак, мы видим инверсию и фигуры идеальной героини, и сюжетных ходов, и тематики, типичной для бестселлеров. В 1-й главе мы констатировали, что большинство успешных писателей знает неявные правила, по которым строится художественная литература, – причем знают так хорошо, что умеют выворачивать их наизнанку. «Романы про девушек» прекрасно иллюстрируют это умение. Как вы помните, самая важная тема, помогающая выявлять бестселлеры, – это близость между людьми. При чтении кратких пересказов сюжета не похоже, что она встречается в каком-либо из «романов о девушках». Но, если верить нашей модели, это на самом деле не так: тема человеческой близости занимает 11 % «Исчезнувшей» и 15 % «Девушки в поезде». Конечно, в обоих романах автор умело искажает ее, словно отражая в кривом зеркале. Брак, семья, дом становятся чуждым человеку пространством. А вот в «Девушке с татуировкой дракона» эта важная тема практически отсутствует: в тематическом списке романа она занимает сорок седьмое место, а по объему – менее полпроцента. Такое отсутствие ощутимо и обоснованно, потому что именно человеческой близости не хватает Лисбет. Самое похожее из того, что мы находим в тематическом списке, – «общение друзей». Мы как читатели хотим, чтобы Лисбет поняла: несмотря на всю ее гениальность, ей нужны другие люди. Конечно, она это понимает, но в идеальной развязке ей отказано.

Все книги про девушек – в конечном счете «романы характеров». Героини не укладываются в стандартную роль «нормальной девушки» или выпадают из нее, в ней тесно всем троим. Вероятно, многие читатели также не удовлетворены этой ролью. Мы чувствуем, что для героини (и для читателей) на кону стоит сама ее суть, ее ощущение принадлежности к чему-то. Лисбет подверглась насилию и отчуждению со стороны системы, призванной защищать ее как сироту. Рэйчел описывает себя так: «бесплодная, разведенная алкоголичка, которая скоро станет еще и бездомной». Она выкинута из всех традиционных женских ролей – матери, жены, хранительницы домашнего очага, – а потом теряет и работу. Эми остро чувствует, что недотягивает до «изумительной Эми», своей тезки – героини созданной ее родителями серии детских книг, продающихся миллионными тиражами. Изумительная Эми идеальна: умна, честна, красива, женственна и добра. Невозможность конкурировать с ней разрушительно влияет на душу Эми – главной героини «Исчезнувшей». Однако в то же время Лисбет – лучший хакер мира, Рэйчел – сыщик-любитель, а Эми – выдающийся криминальный талант. Каждая из них в чем-то одарена, как часто бывает с героями бестселлеров, и каждая полна решимости использовать эти таланты для поисков своего места в жизни. То, что в современной литературе все три героини испытывают с этим сложность, доказывает, что для «книжных девушек» в нашей культуре еще много работы. Пока все они не обретут развязку и душевный мир, книги о них будут в моде. Реплика в сторону, издательнице: продолжайте покупать рукописи про девушек!

Списки: персонажи

Лучшие десять книг с точки зрения агентивности мужских персонажей

1. «Хищник», Патрисия Корнуэлл (Predator, Patricia Cornwell)

2. «Жених напрокат», Эмили Гиффин (Something Borrowed, Emily Giffin)

3. «Бремя молчания», Хизер Гуденкауф (The Weight of Silence, Heather Gudenkauf)

4. «На пятьдесят оттенков темнее», Э.Л. Джеймс (Fifty Shades Darker, E. L. James)

5. «Черный дом», Стивен Кинг и Питер Страуб (Black House, Stephen King, Peter Straub)

6. «Увлечение Стеллы», Терри Макмиллан (How Stella Got Her Groove Back, Terry McMillan)

7. «Ночной цирк», Эрин Моргенштерн (The Night Circus, Erin Morgenstern)

8. «Зоопарк», Джеймс Паттерсон (Zoo, James Patterson)

9. «Ангел для сестры», Джоди Пиколт (My Sister’s Keeper, Jodi Picoult)

10. «Халтурщики», Том Рэкман (The Imperfectionists, Tom Rachman)

Лучшие десять книг с точки зрения агентивности женских персонажей

1. «След», Патрисия Корнуэлл (Trace, Patricia Cornwell)

2. «Комната», Эмма Донохью (Room, Emma Donoghue)

3. «Второй шанс», Джейн Грин (Second Chance, Jane Green)

4. «Рэкетир», Джон Гришэм (The Racketeer, John Grisham)

5. «Воды слонам!», Сара Груэн (Water for Elephants, Sara Gruen)

6. «Тихая жена», А.С.А. Харрисон (The Silent Wife, A.S.A. Harrison)

7. «Пятьдесят оттенков свободы», Э.Л. Джеймс (Fifty Shades Freed, E.L. James)

8. «Поезд сирот», Кристина Бейкер Клайн (Orphan Train, Christina Baker Kline)

9. «Дневник Сюзанны для Николаса», Джеймс Паттерсон (Suzanne’s Diary for Nicholas, James Patterson)

10. «Последнее правило», Джоди Пиколт (House Rules, Jodi Picoult)

6. Избранный, или Когда компьютер смеется

Вы в гостях, и вас с кем-нибудь знакомят. Новый знакомый первым делом спрашивает, чем вы занимаетесь. Если вы наш коллега, то скажете, что вы литературовед. Очень часто собеседник машинально реагирует вопросом: «А почему?»

– Слова! – отвечаете вы и, видя непонимающий взгляд собеседника, решаете объяснить: – Предложения! Персонажи! Романы! Идеи! Сюжеты!

В этот момент следующий вопрос собеседника можно предсказать с точностью почти 100 %. Если вы любите читать и не скрываете этого, то, скорее всего, сталкиваетесь с пресловутым вопросом так же часто, как мы.

– Какая ваша любимая книга?

О, какой ужас вызывает у вас этот вопрос, если вы любите читать или, хуже того, ваша работа состоит в чтении книг! Как ответить на него, чтобы удовлетворить пытливость нового знакомого и не почувствовать себя гнусным обманщиком? Ответив «Ну, то одна, то другая», вы покажетесь собеседнику полным идиотом.

Вопрос о любимой книге – на самом деле просьба порекомендовать одну книгу, которая заслуживает прочтения. Собеседник, по сути, просит убедить его, что на эту книгу стоит потратить время. Если вы не литературовед, а биржевой брокер или врач, аналогичный вопрос вам не покажется странным. Назовите одну фирму, акции которой стоит прикупить. Дайте один хороший совет, как сохранить здоровье. Но назвать один роман из сотен тысяч? Какая ужасная, невыносимая ответственность!

Возможно, вас выручит заранее подготовленный ответ. Если хотите прослыть эрудитом, назовите «Улисса». Но тогда вы рискуете отпугнуть нового знакомого, показавшись ему несносным интеллектуалом или типичным гуманитарием. Если вы хотите выглядеть образованным человеком, не отстающим от моды, выберите одну из многочисленных книг, «обязательных для прочтения», но недочитанных вами и скопившихся на тумбочке у кровати. Их авторы наверняка окончили учебные заведения для писателей. «Судьбы и фурии»[230], «Город в огне»[231], «Искусство поля». Но тут загвоздка в том, что вас могут спросить, чем заканчивается книга, и вы попадете в дурацкое положение. Другая стратегия, позволяющая создать имидж начитанного человека, – выбрать книгу, отмеченную Пулитцеровской премией, тут уж не ошибешься. «Ой, даже не знаю, на этой неделе моя любимая – “Короткая фантастическая жизнь Оскара Вау”»[232]. Но этот роман полон запутанных примечаний, и его так просто не перескажешь за бокалом мартини. Можно выбрать пляжное чтиво – детектив или триллер, осиленный вами во время последнего отпуска. Дэвида Балдаччи, Нору Робертс или Майкла Коннелли. Но о том, что любишь такое, как-то не принято рассказывать, хотя подобную литературу читают все (надеемся, что после прочтения «Кода бестселлера» вы поймете, почему так происходит).

Что же делать? Можно прибегнуть к беспроигрышному варианту и назвать «Жизнь Пи»[233] – но это будет явная капитуляция. Возможно, вам нравятся многие книги, и названия ваших фаворитов школьных лет уже вертятся на языке: «Убить пересмешника», «Гордость и предубеждение», «Рассказ служанки»[234]. Может быть, вам вспомнятся экранизированные романы: вероятно, ваш новый знакомый хотя бы слышал о них: «Дорога», «Серебристый луч надежды», «Навеки Элис». Наконец вы решаетесь и называете «Оскара Вау». Вы тут же понимаете, какой вопрос будет следующим. На него тоже можно ответить в лучшем случае с оговорками.

– Хм, интересно. А почему именно эта книга?

Вы, конечно, знаете, что не отделаетесь ответом вроде «Потому что она хорошо написана». Даже не надейтесь.

Давайте пока подождем с ответом на этот вопрос и постараемся понять, что именно происходит. Вы в гостях и пытаетесь объяснить другому гостю, за что Хунот Диас получил Пулитцеровскую премию. Мы вам немного поможем. Стиль Диаса в «Оскаре Вау» таков, что нравится большому количеству читателей. Характеризация персонажей (особенно мужских) в его книгах идеальна на 99 %. Но кроме этого, вы сейчас находитесь в ситуации, полной неявных социальных ожиданий, типичных для американской культуры. Мы уже упоминали, что наша культура требует назвать номер первый, победителя, избранника, единственного лидера. Поэтому выбор важен. Он влечет за собой последствия.

Рекомендовать книгу – совсем не то, что дать совет по покупке акций или здоровому образу жизни. Рекомендуя книгу, вы оказываетесь в лабиринте неписаных правил и запретов, которых у нас не меньше, чем на светском рауте времен Джейн Остин. Книжный мир нагружен немалым багажом традиций и мнений. Снобизм считается позорным. Антиснобизм – тоже. Хороший вкус и элегантность – подозрительны. Есть куча стигматизированных жанров, от которых лучше держаться подальше, и стереотипов, под которые не хочется подпасть. Например, читать эротические романы – стыдно. Если вы любите фантастику, вас тут же сочтут типичным «ботаном». Все ненавидят элитарность – высоколобых критиков, объясняющих свысока, что такое «настоящая литература». И все эти соображения проносятся у вас в голове, когда вы пытаетесь выбрать любимую книгу для рекомендации новому знакомому. Именно поэтому назвать такую книгу и объяснить свой выбор – все равно что обнажить перед первым встречным кусок души. Все эти традиции и предрассудки висят невидимым грузом на любом публикуемом списке для чтения. Разговоры о книгах чреваты конфликтами. Смотрите, что произошло в 2001 году, когда Опра Уинфри рекомендовала «Поправки» Джонатана Франзена. Франзен обозвал другие рекомендованные Опрой книги «слезливыми» и заявил, что его роман рассчитан на интеллектуального читателя и, следовательно, ему не место в книжном клубе Опры. Или вспомните, что случилось в 1960-м, когда издательство Penguin Books рекомендовало «Любовника леди Чаттерлей»[235]. На издательство подали в суд из-за непристойного содержания романа. А что было, когда Марк Цукерберг поделился рекомендациями по чтению? Его список перепечатали газеты всего мира, с комментариями. Комментарии были практически одинаковые – например, английская газета заявила, что после такого списка с Цукербергом все ясно. Что именно стало ясно по книжным предпочтениям основателя Facebook, газета не сочла нужным указать – очевидно, решив, что это и так понятно. Когда кто-нибудь публично рекомендует книгу, результатом всегда бывает реакция прессы, ответные мнения и споры. Всегда.

Но вернемся к гостям.

Все говорят о том, какую книгу любят больше всего и почему. Один назовет «Сына повелителя сирот», потому что Адам Джонсон – потрясающий писатель. С этим никто спорить не будет. Другая скажет: «“Виноваты звезды”[236], я себе все глаза выплакала, пока читала». И ее поймут. Но что, если вы можете внести в этот разговор нечто новое? Может быть – ошеломляющее. Может быть – возмутительное. Но, несомненно, уместное.

Что будет, если вы обойдете тернистую тропу вкусов, усеянную минами культурных табу, и назовете любимую книгу компьютера? Что будет, если вы скажете: «Компьютерная система прочитала тысячи книг и безо всяких сторонних подсказок назвала одну, ту самую, избранную, главную, с индикатором успеха 100 %»? Что, если этот выбор можно объяснить не общими словами, а пачкой таблиц и графиков? Что тогда скажет ваш новый знакомый, стоя с коктейлем в руке? И почему? Сможете ли вы, хотя бы как книголюб, оправдать выбор, сделанный компьютером?

Все эти вопросы мы задали себе, прежде чем решиться на проект. Они пугали. Был и один новый элемент – мы решились слепо довериться компьютеру. Мы взяли на себя обязательство опубликовать полученный результат, каков бы он ни был. Но мы не знали тогда, что компьютер решит подшутить над нами и его выбор, наконец сделанный после пяти лет обучения модели, окажется полон зловещей иронии.

Итак, называйте это утопией или антиутопией, а нас – «ботанами», если хотите, но мы привели компьютер с собой в гости.

Точка совершенства

Вы уже знаете, кто мы и чем занимаемся, и хорошо представляете себе, как устроен бестселлерометр. В 1-й главе мы объяснили, что наша модель берет тысячи точек данных и на их основе создает агрегатный индекс, показывающий вероятность попадания в список бестселлеров New York Times. Для книг из нашего корпуса текстов ответы компьютера «да» и «нет» оказывались правильными примерно в 80 % случаев. Для каждой книги также вычислялась вероятность, с которой она станет бестселлером. Большинство романов, упоминаемых здесь, получили оценки вероятности выше 90 %. Во 2-й главе мы описали часть алгоритма, выявляющую темы, а также рассказали, какие темы и в каких пропорциях делают книгу бестселлером и обеспечивают длительные высокие продажи. Компьютер установил, что книги, имеющие самый большой успех на рынке, посвящены 3–4 основным темам, которые при этом занимают около 30 % объема романа. Кроме этого в нем могут быть и другие темы, второстепенные, в меньших объемах – они придают колорит. Компьютер также открыл нам, что самая частая и популярная тема в бестселлерах – это тема человеческой близости, эмоциональных отношений между персонажами. Среди других популярных тем были домашняя жизнь, работа (согласно Стивену Кингу, люди любят читать про чужую работу), дети в школе и современные технологии.

В 3-й главе мы смотрели на сюжетные линии, графики которых эффективно моделируются с помощью анализа слов, описывающих эмоциональное состояние персонажей. Графики сюжетов бестселлеров могут быть самыми разными, но за последние тридцать лет заметное количество самых успешных книг обладает волнообразными сюжетными графиками, идущими то вверх, то вниз. Модель показала нам, что симметрия сюжетной линии и четко выраженная трехчастная структура обещают успех у читателей. Мы также увидели, что, умело управляя эмоциями читателей на этих «качелях», автор может добиться впечатляющих тиражей в глобальном масштабе.

Однако без понимания стиля и его воздействия на читателей ни один автор не попадет в список, даже с правильными темами и захватывающими изгибами сюжета. В 4-й главе мы показали, как модель анализирует стиль в ходе общего анализа. Мы обнаружили, что для создания стиля, позволяющего сделать книгу бестселлером, автор обязательно должен понимать, как устроена повседневная речь. Если вы хотите с гарантией покорить читателя, вероятно, вам не помешает поучиться литературному мастерству, но мы также рекомендуем поработать в прессе, рекламном деле или маркетинге, чтобы получить практический опыт.

В 5-й главе мы объяснили, что книга становится бестселлером благодаря персонажам – в частности, тому, какие глаголы используются для описания их действий. Мы рассмотрели нынешнюю моду на неоднозначный женский персонаж с ярко выраженными как положительными, так и отрицательными чертами характера и увидели, какой сюжетный график образуется благодаря этому персонажу. Такая героиня, как правило, фигурирует в книгах, где священному домашнему очагу что-то угрожает. Ужасы внешнего мира вторгаются в самые интимные сферы жизни. Агентивность героини чрезвычайно высока (и даже несколько пугает).


Признаемся: нам нравится думать, что где-то какой-то писатель сейчас читает эти строки и думает: «О Боже, я написал именно тот единственный, главный, идеальный роман!» Несомненно, у этого писателя тончайший слух, улавливающий пульс эпохи. Он (или она) чрезвычайно проницателен и благодаря этому самостоятельно пришел к тем же выводам, что и наш компьютер. То есть этот писатель точно знает, что должно быть в книге, чтобы она стала бестселлером. Может ли творческий процесс быть настолько осознанным?

В предыдущих главах мы рассмотрели разные элементы, составляющие роман, но такой подход создает несколько обманчивую картину. Можно многое узнать о книге, анализируя ее темы, стиль и так далее, но истина состоит в том, что успешное произведение возникает лишь при слиянии всех этих элементов. Нельзя преуспеть в одном аспекте и потерпеть неудачу в другом. Неверно задуманный персонаж обусловит неправильную форму сюжета. Неудачно подобранные темы сузят выбор возможных персонажей. Чтобы добиться большого успеха, автор должен быть выдающимся мастером во всех рассмотренных нами слагаемых литературного произведения. Чтобы получить высокую оценку у нашей модели, автор должен дойти до точки совершенства во всех аспектах создания романа – от названия и первой строки до последнего абзаца и всех эмоциональных взлетов и падений в промежутке между ними.

Анатомия идеального романа

Как вы уже знаете, разработанная нами система генерирует графики и таблицы на основании текста. На каждую книгу мы получаем отчет длиной около пятнадцати страниц, из которого можно узнать о ней все – от формы сюжета до особенностей использования артикля the, от глаголов, характерных для разных персонажей, до частоты употребления прилагательных (таких, как «маленький», «важный» и «черный»). Когда прочитаешь несколько сотен таких отчетов и пронаблюдаешь за тем, как описанные в них книги на самом деле продаются, одного беглого взгляда на ползущие из принтера страницы отчета становится достаточно, чтобы понять, гарантирован ли книге успех.

Мы получили один отчет – только один, – который выглядел следующим образом.

1. Тематический состав

Три темы составляют примерно 30 % объема книги – как мы знаем, это формула успеха. Темы эти следующие: 21 % – современные технологии, 4 % – работа и рабочее место, 3 % – человеческая близость. Среди трех тем – главная тема бестселлеров и две другие, входящие в первую десятку тем, характерных для бестселлеров.


2. Сюжет

Трехчастный сюжет – такой же, как у «Пятидесяти оттенков серого». Эмоциональный график сюжета, описывающий книгу более подробно – сцена за сценой, – обладает симметрией, характерной для немногих опубликованных романов. Книга кончается на более мрачной ноте, чем началась. Это роднит ее не только с «Пятьюдесятью оттенками серого», но и с новым явлением, «романами о девушках». См. рис. 17.


3. Стилистический анализ

Стиль книги – почти идеальная комбинация «мужского» стиля писателей, получивших традиционное литературное образование, и «женского» стиля писателей, работавших в журналистике и рекламе. Оценка стиля – на 52 % «мужской» и на 48 % «женский». Частота встречаемости сокращений, таких как -‘ll[237] и -‘d, соответствует бестселлерам, как и другие детали стиля, создающие узнаваемый голос. Количество восклицательных знаков на приемлемо низком уровне, в то время как количество запятых и точек достаточно высоко, что указывает на правильную длину предложений.


4. Персонаж

На основе поведения женских персонажей можно предсказать, что книга станет бестселлером, с вероятностью 99 %. Центральный персонаж – женщина. Она обладает высокой агентивностью и играет основную роль в сюжете, который заканчивается на более мрачной ноте, чем начинается. Наиболее часто героиня употребляет глаголы need и want.


5. Суммарная вероятность того, что книга попадет в список бестселлеров New York Times: 100 %.

Нас, двух книжных червей, этот отчет просто опьянил.

Рис. 17


Стал ли бестселлером описанный в отчете роман? Да. Сочли ли мы этот выбор правильным как литературоведы и любители чтения? Если честно, мы не смогли бы ответить. Оказалось, что мы не читали названную компьютером книгу. Но имя автора удивило и заинтриговало нас, и заглавие – тоже. Мы ожидали, что роман-победитель будет принадлежать перу известного автора, который, разумеется, овладел всеми слагаемыми успеха и затвердил их наизусть. Возможно, думали мы, это будет Ли Чайлд, или Нора Робертс, или Джон Гришэм. Мы заключали дружеские пари, ставя на Николаса Спаркса и Джанет Иванович. Мы также думали, что, может быть, компьютер выберет внежанрового писателя – такого, который хорошо понимает правила и ограничения разных жанров, но умело инвертирует или нарушает их. Мэтт все время защищал роман Эммы Донохью «Комната», а Джоди уговаривала Мэтта прочитать «Милые кости» Элис Сиболд. Мы ужасно веселились, расписывая друг другу разнообразные коммерческие достоинства различных писателей. Но никто из нас ни разу не назвал роман, который вышел победителем.

По мнению нашего компьютера, лучшей книгой среди всех опубликованных за последние тридцать лет оказалась «Сфера» Дэйва Эггерса.

Жизнь причудливей всякого вымысла

Из Дэйва Эггерса вышел бы отличный литературный герой. В его биографии множество деталей, характерных для героя в архетипическом сюжете. Возможно, он, как добротно сработанный персонаж бестселлера, знает о себе и это. Эггерс и впрямь пробился на литературный Олимп с помощью книги о себе самом. Его дебютный роман, «Душераздирающее творение ошеломляющего гения»[238] (ничего себе заглавие, да?) – автобиографический, с элементами художественного вымысла. Это воспоминания о том, как Дэйв воспитывал младшего брата в Калифорнии после смерти обоих родителей. Эггерс стал тем, кого мы называем дебютантом, – его самая первая книга попала в список бестселлеров. Точнее, заняла первое место в списке и оказалась в числе финалистов Пулитцеровской премии. Мало кто из авторов обладает таким интуитивным и детальным пониманием читателя, как Эггерс. Причем не только массового читателя, ответственного за попадание книги в списки бестселлеров, но и элитарного – членов комиссий по присуждению престижных премий. Подобное мгновенное ориентирование на рынке указывает в том числе на отличное чувство стиля у писателя.

Выше мы говорили, что авторский стиль, с одной стороны, присущ писателю от природы, а с другой стороны, вырабатывается. С помощью компьютерных моделей мы доказали не только то, что у каждого писателя есть неповторимый стилистический «отпечаток пальца», но и то, что можно распознать некоторые факторы, повлиявшие на стиль писателя, – особенно разницу между традиционным литературным образованием и подготовкой журналиста. Многие авторы, попавшие в список бестселлеров с дебютным романом, до этого работали в журналистике, и Эггерс – не исключение. Он получил диплом журналиста и до публикации первой книги успел основать свое издательство и журнал Timothy McSweeney’s Quarterly Concern. Однако, в отличие от многих своих коллег с опытом работы в СМИ, Эггерс не пишет в так называемом женском стиле, который мы обсуждали в 4-й главе. Компьютер оценил его как 50/50 – это значит, что Эггерс освоил стиль, наиболее типичный для бестселлеров, и в то же время – стиль, который больше всего нравится различным комиссиям по присуждению литературных премий. В списке наград, полученных Эггерсом, – Американская книжная премия, Дейтонская литературная премия мира, Prix M?dicis, премия Heinz и премия TED. В списке званий – «Лучшая книга года по версии журнала Time», «Лучшая книга года по версии газеты Washington Post», почетная степень доктора литературы из Университета Брауна и номинации на многие другие литературные премии.

Однако Эггерс, оказывается, не просто сообразительный персонаж-писатель, который находится в центре сюжета, движущегося «из ямы в гору». Он, как всякий уважающий себя герой бестселлера, обладает определенными суперспособностями. Эггерс – один из основателей некоммерческого центра репетиторства и писательского мастерства для детей, а также основатель другой некоммерческой организации, которая ищет спонсоров для оплаты стипендий, чтобы малообеспеченная молодежь могла после школы идти учиться дальше. Эггерс написал много романов, рассказов и произведений документальной литературы, в том числе книгу про человека по фамилии Зейтун, подвергшегося несправедливому обращению после урагана «Катрина», и роман на основе подлинной истории суданского беженца. Эггерс женат, у него двое детей. Многие считают его красивым.

Мы так долго исследовали разные компоненты бестселлера, что теперь обязательно должны рассмотреть и жизнь Дэйва Эггерса в этом аспекте. Глядя на принятые им решения, определившие течение его жизни (так сказать, его агентивность как персонажа), нельзя не заметить в нем темы и эмоционально окрашенные события, характерные для сюжетов бестселлеров. По крайней мере, на бумаге Эггерс – воплощенный идеал американского мужчины, тот самый совершенный герой, которого нам не хватало в предыдущей главе, когда мы говорили про «романы о девушках». Он и правда существует? Может, он сговорился с нашим компьютером?

Но шутки компьютера на этом не закончились.

Когда бестселлерометр назвал «Сферу» образцовым бестселлером, оказалось, что ни один из нас ее не читал. Мы почувствовали себя полными идиотами. Конечно, мы немедленно купили по экземпляру и прочитали – быстро, синхронно, в процессе обсуждая по телефону. Мы начинали читать в приподнятом настроении. Разумеется, мы хотели постичь скрытый генотип книги, ее анатомическое совершенство. Взять хотя бы название, The Circle[239]. Очевидно, оно относится к группе названий из одного существительного с определенным артиклем. И существительное это – глубокое, многозначное. Что такое круг? Нечто завершенное, совершенное, возможно – намек на взаимодействие людей («круг общения»), с легким намеком на колдовство («заколдованный круг»). А что такое «тот самый круг»? Мы не знали, но вот-вот должны были выяснить.

Пока мы установили, что название книги весьма эффективно, и первое предложение – тоже. Оно мгновенно попадает в цель. My God, Mae thought, it’s heaven[240]. В этом предложении есть все элементы бестселлера, которые мы обсуждали на протяжении последних четырех глав. Оно грамматически сбалансированно. Оно короткое. Содержит сокращения. У него правильный тон. Действующее лицо – женщина. Использован глагол, характерный для бестселлера. К тому же если героиня говорит о рае, это наводит на мысль, что очень скоро она попадет в ад. И еще мы подумали – может, она из «тех самых девушек»?

На этих страницах мы много внимания уделили первым предложениям бестселлеров. Очень часто их задача – обрисовать эмоциональный расклад. По-настоящему действенные открывающие книгу предложения описывают отношения между первым упоминаемым персонажем и кем-то еще, чье присутствие указано в явном виде или подразумевается. Это отношение часто и становится центральным конфликтом романа. Судя по примерам, приведенным в 4-й главе, другим человеком может быть придирчивый полицейский, любовник, какой-нибудь родственник. Но у Мэй все гораздо интереснее. Она вообще превзошла большинство литературных героев по многим параметрам. Отношения, которые мы видим в первом предложении книги, – не между Мэй и каким-нибудь другим человеком, но между Мэй и Божественным началом. Мы предполагаем, что Мэй все-таки жива, а это значит, что она обрела рай на земле. Такое начало содержит иронический намек на будущие события романа, темы которого, как мы позже выяснили, – всеведение и утопия. Зловещее предчувствие, возникшее у нас с первой фразы, оправдается – посмотрите на график сюжета, и вы увидите, как скоро после начальной эйфории Мэй окажется в глубокой эмоциональной яме.

Мэй попадает в рай, поступив на новую работу. Ее приняли в футуристическую технологическую компанию, которая выглядит как плод брака между Facebook и Google, обвешанный побрякушками от Apple. Мы узнаем это на самых первых страницах романа, по которым уже можно определить его тематический состав: 21 % – современные технологии, 4 % – работа и рабочее место, 3 % – человеческая близость. Большая часть подтекста посвящена влиянию первых двух тем на третью. Здесь кроется, как мы уже объясняли во 2-й главе, потенциал для конфликта, а конфликт с наибольшей вероятностью возникает в столкновении главных тем романа. Еще не начав читать, мы уже знали из отчета, что это, скорее всего, один из тех бестселлеров, где тема человеческой близости по-прежнему стоит в центре внимания, но вывернута наизнанку.

Часть рабочих обязанностей Мэй в «Сфере» – улучшать некий документ, шаблон ответа на запрос клиента, с конечной целью – повысить удовлетворение клиентуры. Успешность работы Мэй измеряется по отзывам клиентов. Индекс 98 % – не идеально, но сойдет. 93 % – ужасно. Идеальные 100 % – святой Грааль, к которому надо постоянно стремиться. Чтобы достичь ста процентов, Мэй должна понимать свою аудиторию и идеально подгонять текст под ее интересы, удовлетворяя интеллектуальные и эмоциональные потребности клиентов. Да-да, мы заметили всю иронию ситуации. Наш алгоритм выбрал книгу о своем двойнике!

Читая дальше о приключениях Мэй в «Сфере», мы узнавали многие составляющие современных бестселлеров. Мэй не просто неоднозначный женский персонаж, она – квинтэссенция женского персонажа с темными сторонами души. Она не просто, подобно героиням «новых бестселлеров о девушках», вносит нечто угрожающее и потенциально ужасное в частные пространства дома, романтических отношений и семьи – она олицетворяет тотальное уничтожение разницы между публичным и частным пространством. Она стирает все границы и при этом улыбается. Став «евангелисткой», продвигающей новейшие продукты «Сферы», Мэй использует свою агентивность, чтобы помочь вторжению технологий не только в семейные и романтические отношения, но и в человеческую душу. Причем Мэй – и это тоже отличает ее от прочих «девушек из списка NYT» – то ли не осознает, то ли подавляет осознание последствий своих поступков. В результате она бессильна предотвратить катастрофу и не понимает своей роли в провале отношений с другими людьми. Но в конце книги Мэй не учится на своих ошибках и не решает отныне жить по-новому – она думает о том, как бы с помощью технологий прочитать и транслировать на весь мир мысли лучшей подруги. «Что за мысли она там себе думает? Почему нельзя выяснить? Мир никак не заслуживает меньшего и ни минуты не желает ждать». Сюжет начинается в «раю», а заканчивается, без сомнения, в кошмаре будущей технологической антиутопии, подобной одному из кругов Дантова ада.

Мы не будем больше пересказывать «Сферу». Она заслуживает прочтения, и мы не хотим портить вам удовольствие. Достаточно сказать, что, прочитав роман Эггерса, мы снова убедились в правильности нашего алгоритма: книга представляет собой идеальную комбинацию разных аспектов бестселлера в наилучших пропорциях. Но мы также почувствовали, что в этом выборе есть нечто сверхъестественное и жутковатое.

Нам даже отчасти неловко. Дэйв Эггерс написал роман-предостережение о новых технологиях, в которых работу главной героини оценивают в процентах. Она одна из лучших сотрудников фирмы, ее показатель все ближе подходит к 100 %, отчего довольны не только клиенты, но и коллеги. Что тут можно сказать? Дэйв Эггерс получил от нашего компьютера высшую оценку – 100 %. Сознательно или бессознательно, намеренно или невольно он постиг скрытые формулы литературы, вплоть до запятых, союзов и обычных повседневных существительных. Если верить нашей модели, Эггерс – писатель, идеально отражающий основные тенденции развития литературы в последние тридцать лет. Похоже, наш компьютер над нами неплохо подшутил. Мы не знали, что с ним теперь делать – сводить в ресторан или разбить молотком.

Приз зрительских симпатий

Если бы мы и в самом деле взяли компьютерную модель с собой в гости, она вела бы себя очень провокационно. Мы это знали еще в самом начале проекта. Но чем умнее становилась модель, тем лучше, кажется, понимала, что следует и чего не следует говорить (заметьте, мы ее этому не учили). Как мы уже рассказали, из всех книг, опубликованных за тридцать лет, компьютер выбрал ту, в которой показаны усовершенствованные компьютерные технологии как возможная причина гибели этики и цивилизации. После этого мы попросили компьютер назвать нам лучший роман из всех произведений, которые считаются «серьезной литературой».

И что же ответил компьютер? Он назвал «Свободу» Джонатана Франзена. Кошмар! Разве он не помнит, какой поднялся крик, когда Опра Уинфри выбрала эту книгу? Неужели он не знает о километрах газетных и журнальных колонок, написанных по поводу выбора Опры, о битве между «высоколобыми» и «узколобыми», элитой и массами в вопросе о хорошей и плохой литературе и о том, кому следует и кому не следует высказываться по этой теме? Но компьютеру было все равно. Он дал Франзену оценку 90 %, поместив его в список рядом с Сильвией Дэй. Оказывается, эти два писателя не настолько отличаются друг от друга, как хотелось бы думать каждому из них.

Мы также попросили компьютер разрешить публичный спор между Джеймсом Паттерсоном и Стивеном Кингом. Как известно, Кинг вечно отпускает шпильки Паттерсону, обвиняя его в неумении писать. Паттерсон же в ответ лишь указывает на огромные тиражи своих книг. И вот мы спросили компьютер: кто из этих двух авторов ближе к идеалу – прозе, достойной попадания в список бестселлеров?

В этом случае ответ нас ничем не удивил. Они оба туда попадут, сказал компьютер. И продержатся там долгое время. Но под давлением он сознался, что Паттерсон все же чуть ближе к заветной отметке 100 %.

Нам хочется думать, что мы правильно научили бестселлерометр распознавать читательские вкусы. Хотелось бы надеяться, что он понимает, как важна литература для миллионов людей, жертвующих свободным временем ради хорошо рассказанных историй. Что же до противоборствующих партий и их мнений – наш компьютер оказался великим уравнителем. Он хвалил романы из самых разных областей литературы.

Какому же роману наша система присудила второе место, после «Сферы»? «Последнему правилу» Джоди Пиколт. Компьютер высоко оценил все книги Пиколт, но больше всего ему понравились «Правила» и «Девятнадцать минут». На третье место, после книги Пиколт, компьютерная модель снова поставила роман, который никто из нас не читал. Однако мы с уверенностью можем рекомендовать его. Компьютер доказал нам, что «Куда ты пропала, Бернадетт?» Марии Сэмпл – практически идеальное сочетание элементов, необходимых для бестселлера.

В итоге мы не удержались и сгенерировали собственный список. В конце этой главы вы увидите список рекомендованного чтения, составленный компьютером, – сто романов, среди которых, как мы надеемся, найдется что-нибудь по вкусу для каждого читателя.

Исследования, легшие в основу нашего труда, полностью изменили наши взгляды на книги, писательский труд и литературную критику. Мы повысили квалификацию как читатели и как преподаватели, а также узнали о существовании некоторых писателей, чьи книги теперь числим среди своих любимых. Мэтт должен признаться, что, когда в 2010 году Джоди пришла к нему и сказала, что хочет серьезно заняться бестселлерами, его ответ был: «Чего?!» Он в это время работал над алгоритмом для распознавания литературных шедевров, который окрестил «канонизатором», а Джоди хотела изучать книги, какие обычно покупают в аэропорту на пересадке, чтобы убить время. Мэтт по образованию был исследователем Джойса и даже читал в университете курс по «Улиссу». Он проштудировал каждую страницу «Поминок по Финнегану»[241] и мог продекламировать первую и последнюю из них наизусть (чем иногда и занимался на кафедральных вечеринках).

Вместе с тем именно Джоди принадлежал тот самый голос, который на семинаре Мэтта по цифровым гуманитарным наукам однажды крикнул: «Ну и что?» С ее опытом в издательском деле и современной литературе она просто не понимала, какая польза может быть от компьютера в литературоведении. Когда ей объяснили, что компьютер умеет распознавать, является ли пьеса Шекспира трагедией или комедией, Джоди ответила: «Кого это волнует?» Ведь литературоведы из плоти и крови уже и так все это знают. Джоди защищала традиционные методы публикации, анализа и рекомендации книг. Ну что ж, Мэтт воспринял ее «упрямство» (его шутливое словечко) как вызов и продолжал программировать. Сейчас Джоди вполне готова основать клуб любителей применения компьютера в литературоведении.

И вечеринки с коктейлями, а также лекции и семинары Мэтта теперь совсем не те, что раньше. Мэтт очень полюбил роман «Дьявол носит Prada», а после пары коктейлей берет собеседника за пуговицу и начинает читать лекцию о «Пятидесяти оттенках серого». А прислушавшись хорошенько на той же вечеринке к Джоди, вы услышите, как она весьма эффективно использует выражения вроде «латентные размещения Дирихле». В этом году Мэтт все так же вел свой обычный семинар по «Улиссу», но прибавил к нему другой – по современным бестселлерам. Наши студенты читали Дэна Брауна, Энтони Дорра, Гиллиан Флинн, Джона Гришэма, Сью Монк Кидд, Элис Сиболд и Николаса Спаркса. Оба семинара авторы вели вместе и в итоге поняли, насколько важно для студентов, изучающих литературу, знакомство с этими писателями – наиболее успешными из ныне живущих.

Мы считаем, что бестселлерометр может заставить нас по-новому писать, по-новому издавать книги и по-новому читать только что вышедшие произведения. Мы надеемся, что он поможет вам взглянуть с некоторым уважением на тех писателей, которых обычно сбрасывают со счетов. Мы надеемся, что он вдохновит начинающих авторов, а самым закоренелым традиционалистам подкинет свежую пищу для ума. В конце концов, бестселлерометр есть не что иное, как проявление нового подхода к литературе, и в то же время – новый инструмент, помогающий увидеть и понять, какое это чудо – хорошая книга.

Списки: все точки данных

100 романов, которые наш компьютер советует прочесть

1. «Сфера», Дэйв Эггерс (The Circle, Dave Eggers)

2. «Последнее правило», Джоди Пиколт (House Rules, Jodi Picoult)

3. «Куда ты пропала, Бернадетт?», Мария Сэмпл (Where’d You Go, Bernadette, Maria Semple)

4. «Пылающая комната», Майкл Коннелли (The Burning Room, Michael Connelly)

5. «Заказ», Дэвид Балдаччи (The Hit, David Baldacci)

6. «Скарпетта», Патрисия Корнуэлл (Scarpetta, Patricia Cornwell)

7. «Шесть лет», Харлан Кобен (Six Years, Harlan Coben)

8. «Двойной крест», Джеймс Паттерсон (Double Cross, James Patterson)

9. «Острая дюжина», Джанет Иванович (Twelve Sharp, Janet Evanovich)

10. «Защищая Джейкоба», Уильям Ландей (Defending Jacob, William Landay)

11. «Халтурщики», Том Рэкман (The Imperfectionists, Tom Rachman)

12. «Счастливые девочки не умирают», Джессика Нолл (Luckiest Girl Alive, Jessica Knoll)

13. «Серебристый луч надежды», Мэттью Квик (The Silver Linings Playbook, Matthew Quick)

14. «Час, когда я впервые поверил», Уолли Лэмб (The Hour I First Believed, Wally Lamb)

15. «Проект “Рози”», Грэм Симсион (The Rosie Project, Graeme Simsion)

16. «Вглядись в его лицо», Лиза Скоттолини (Look Again, Lisa Scottoline)

17. «Живым или мертвым», Том Клэнси (Dead or Alive, Tom Clancy)

18. «Тайна моего мужа», Лиана Мориарти (The Husband’s Secret, Liane Moriarty)

19. «Начертание», Тим Лахэй и Джерри Дженкинс (The Mark, Tim LaHaye, Jerry B. Jenkins)

20. «Лучшие друзья навсегда», Дженнифер Уайнер (Best Friends Forever, Jennifer Weiner)

21. «Суть дела», Эмили Гиффин (Heart of the Matter, Emily Giffin)

22. «Навеки Элис», Лайза Дженова (Still Alice, Lisa Genova)

23. «Телефонный звонок с небес», Митч Элбом (The First Phone Call from Heaven, Mitch Albom)

24. «Исчезнувшая», Гиллиан Флинн (Gone Girl, Gillian Flynn)

25. «Дальше живите сами», Джонатан Троппер (This Is Where I Leave You, Jonathan Tropper)

26. «Адское пламя», Нельсон Демилл (Wild Fire, Nelson DeMille)

27. «Вязание по пятницам», Кейт Джейкобс (The Friday Night Knitting Club, Kate Jacobs)

28. «Мобильник», Стивен Кинг (Cell, Stephen King)

29. «Настроение полета», Барбара Кингсолвер (Flight Behavior, Barbara Kingsolver)

30. «Свобода», Джонатан Франзен (Freedom, Jonathan Franzen)

31. «Утраченный символ», Дэн Браун (The Lost Symbol, Dan Brown)

32. «Аббатство», Крис Калвер (The Abbey, Chris Culver)

33. «Второй шанс», Джейн Грин (Second Chance, Jane Green)

34. «Последний человек», Винс Флинн (The Last Man, Vince Flynn)

35. «Юрист», Джон Гришэм (The Associate, John Grisham)

36. «Американа», Чимамана Нгози Адичи (Americanah, Chimamanda Ngozi Adichie)

37. «Дневники няни», Эмма Маклафлин и Никола Краус (The Nanny Diaries, Emma McLaughlin, Nicola Kraus)

38. «Дьявол носит Prada», Лорен Вайсбергер (The Devil Wears Prada, Lauren Weisberger)

39. «Next», Майкл Крайтон (Next, Michael Crichton)

40. «Сплетенная с тобой», Сильвия Дэй (Entwined with You, Sylvia Day)

41. «Улица светлячков», Кристин Ханна (Firefly Lane, Kristin Hannah)

42. «Джек Ричер, или Личный интерес», Ли Чайлд (Personal, Lee Child)

43. «Бумеранг судьбы», Татьяна де Росней (A Secret Kept, Tatiana de Rosnay)

44. «На самом дне океана», Жаклин Митчард (The Deep End of the Ocean, Jacquelyn Mitchard)

45. «Девушка в поезде», Пола Хокинс (The Girl on the Train, Paula Hawkins)

46. «Комната», Эмма Донохью (Room, Emma Donoghue)

47. «Штат Мэн», Кортни Салливан (Maine, J. Courtney Sullivan)

48. «Последний тамплиер», Реймонд Хаури (The Last Templar, Raymond Khoury)

49. «Случайная вакансия», Джоан Роулинг (The Casual Vacancy, J. K. Rowling)

50. «Марсианин», Энди Уэйр (The Martian, Andy Weir)

51. «Искусство поля», Чед Харбах (The Art of Fielding, Chad Harbach)

52. «Жутко громко и запредельно близко», Джонатан Сафран Фоер (Extremely Loud & Incredibly Close, Jonathan Safran Foer)

53. «Мое прекрасное несчастье», Джейми Макгвайр (Beautiful Disaster, Jamie McGuire)

54. «Роковая связь», Анита Шрив (Testimony, Anita Shreve)

55. «Время смеется последним», Дженнифер Иган (A Visit from the Goon Squad, Jennifer Egan)

56. «Американская жена», Кертис Ситтенфельд (American Wife, Curtis Sittenfeld)

57. «Пятьдесят оттенков серого», Э.Л. Джеймс (Fifty Shades of Grey, E.L. James)

58. «Где-то в безопасности с кем-то хорошим», Ян Карон (Somewhere Safe with Somebody Good, Jan Karon)

59. «Отныне и навсегда», Нора Робертс (The Next Always, Nora Roberts)

60. «В лесной чаще», Тана Френч (In the Woods, Tana French)

61. «Выбор», Николас Спаркс (The Choice, Nicholas Sparks)

62. «До встречи с тобой», Джоджо Мойес (Me Before You, Jojo Moyes)

63. «Предчувствие конца», Джулиан Барнс (The Sense of an Ending, Julian Barnes)

64. «Великолепные руины», Джесс Уолтер (Beautiful Ruins, Jess Walter)

65. «Поезд сирот», Кристина Бейкер Клайн (Orphan Train, Christina Baker Kline)

66. «Милые кости», Элис Сиболд (The Lovely Bones, Alice Sebold)

67. «Самый темный вечер в году», Дин Кунц (The Darkest Evening of the Year, Dean Koontz)

68. «Перекрестки», Уильям Пол Янг (Cross Roads, Wm. Paul Young)

69. «Щегол», Донна Тартт (The Goldfinch, Donna Tartt)

70. «Короткая фантастическая жизнь Оскара Вау», Хунот Диас (The Brief Wondrous Life of Oscar Wao, Junot D?az)

71. «Предательство Борна», Эрик Ван Ластбадер (The Bourne Betrayal, Eric Van Lustbader)

72. «Брачный договор», Дженнифер Пробст (The Marriage Bargain, Jennifer Probst)

73. «Бремя молчания», Хизер Гуденкауф (The Weight of Silence, Heather Gudenkauf)

74. «Кто не успел, тот опоздал», Терри Макмиллан (A Day Late and a Dollar Short, Terry McMillan)

75. «Белый тигр», Аравинд Адига (The White Tiger, Aravind Adiga)

76. «Зов кукушки», Роберт Гэлбрейт (The Cuckoo’s Calling, Robert Galbraith)

77. «И эхо летит по горам», Халед Хоссейни (And the Mountains Echoed, Khaled Hosseini)

78. «Белка ищет бурундука», Дэвид Седарис (Squirrel Seeks Chipmunk, David Sedaris)

79. «Папочка ушел на охоту», Мэри Хиггинс Кларк (Daddy’s Gone a Hunting, Mary Higgins Clark)

80. «Мертвый в семье», Шарлин Харрис (Dead in the Family, Charlaine Harris)

81. «Гонки на мокром асфальте», Гарт Стайн (The Art of Racing in the Rain, Garth Stein)

82. «Тихая жена», А.С.А. Харрисон (The Silent Wife, A.S.A. Harrison)

83. «Отель на перекрестке радости и горечи», Джейми Форд, (Hotel on the Corner of Bitter and Sweet, Jamie Ford)

84. «Катушка синих ниток», Энн Тайлер, (A Spool of Blue Thread, Anne Tyler)

85. «Питер, Поль и я», Даниэла Стил (The Klone and I, Danielle Steel)

86. «Легкая добыча», Джон Сэндфорд (Easy Prey, John Sandford)

87. «Мировая война Z», Макс Брукс (World War Z, Max Brooks)

88. «Ведьмы», Элеанор Браун (The Weird Sisters, Eleanor Brown)

89. «На новой земле», Джумпа Лахири (Unaccustomed Earth, Jhumpa Lahiri)

90. «Сын повелителя сирот», Адам Джонсон (Orphan Master’s Son, Adam Johnson)

91. «Заклинатель лошадей», Николас Эванс (The Horse Whisperer, Nicholas Evans)

92. «Один день», Дэвид Николс (One Day, David Nicholls)

93. «Оливия Киттеридж», Элизабет Страут (Olive Kitteridge, Elizabeth Strout)

94. «Девушка, которая взрывала воздушные замки», Стиг Ларссон (The Girl Who Kicked the Hornets’ Nest, Stieg Larsson)

95. «Затворница Милл Ривер», Дарси Чен (The Mill River Recluse, Darcie Chan)

96. «Последний ребенок», Джон Харт (The Last Child, John Hart)

97. «Однажды на берегу океана», Крис Клив (Little Bee, Chris Cleave)

98. «Основные цвета», Джо Клейн (Primary Colors, Joe Klein)

99. «На пороге чудес», Энн Патчетт (State of Wonder, Ann Patchett)

100. «Остров проклятых», Деннис Лихейн (Shutter Island, Dennis Lehane)

Эпилог
Роман, написанный машиной, или Почему авторы на самом деле очень важны

Итак, целая книга посвящена тому, как компьютеры читают. После этого логично задать другой вопрос: а могут ли они писать?

В ноябре 2013 года Дариус Каземи твитнул совершенно безумную идею: «Кто хочет составить мне компанию по NaNoGenMo и за месяц создать программу, которая генерирует роман из 50 тысяч слов? В конце месяца опубликуем программу и роман».

NaNoGenMo – сокращение от «всеамериканский месяц генерирования романов», термин, изобретенный самим Каземи. Каземи именует себя интернет-художником, а самое известное его достижение – написание программ, так называемых «ботов», фабрикующих новые предложения на базе текстов из социальных сетей. Один из ботов, созданных Каземи, генерирует «фразы-наживки» для знакомства, но очень неуклюжие: «Девушка, вы, наверно, меламиновая, потому что вы такая пластичная и сделаны из композита», или «Парень, ты, наверно, мегабайт, потому что ты – единица объема компьютерной памяти или хранилища информации, равная 1 048 576 (220) байт». Другая программа, написанная Каземи, производит «по метафоре в минуту». Странные афоризмы этого бота – скорее дзенские коаны, чем элегантные фигуры речи. 4 января 2016 года бот @metaphorminute твитнул следующие бесценные изречения: «сурок подобен лосиной тропе – петушиногребен и упадочническ [sic!]» – и чуть более интересное и глубокомысленное «биограф есть зевака, он дурного воспитания и подлежит ревизии». Подавляющее большинство сгенерированных ботом строчек абсурдны и лишены смысла и глубины. Но порой, натыкаясь на более остроумные словесные находки, задумываешься о том, до чего умными и хитрыми стали машины.

Цели, которые преследует Каземи, создавая ботов, видимо, на две трети развлекательные и на треть провокационные, направленные на то, чтобы побудить людей критически мыслить. Его искусство заставляет и улыбнуться, и задуматься. Его работы не так просты, как кажется. Мы хихикаем, восторгаемся и задумываемся о причудах электронного ума и о тесте Тьюринга, который машины с блеском проходят, выдавая себя за нас.

Заявление Каземи о масштабном замысле – о создании программ, способных сгенерировать целую книгу, – получило шумный отклик. Замысел проекта возник у Каземи по аналогии с NaNoWriMo – «всеамериканским месяцем написания романов», ежегодным конкурсом, проводимым некоммерческой организацией, цель которой – популяризировать «писательское мастерство, развитие творчества и чистое наслаждение от создания книги». Участники NaNoWriMo должны за месяц создать роман объемом 50 000 слов; Каземи же предложил своим читателям в Twitter за месяц обучить компьютер писать романы.

Идея эта не совсем нова. Еще в 1952 году британский кибернетик Кристофер Стрейчи, научив машину играть в шашки и петь детские песенки, решил, что она может также писать любовные письма. Созданная Стрейчи программа работала на компьютере Ferranti Mark 1, о существовании которого Стрейчи узнал через Алана Тьюринга. Она использовала следующий принцип: брала обращения, существительные, глаголы и другие части речи из заранее подготовленных списков и укладывала в различные грамматические конструкции. Получившиеся любовные записки были кратки и без обиняков сразу переходили к сути дела. Эту программу до сих пор можно найти в интернете. Письмо, которое программа написала нам, – вплоть до шрифта Courier и сплошных заглавных букв – перед вами.

HONEY DUCK,

MY PRECIOUS LOVE SEDUCTIVELY PANTS FOR YOUR CRAVING. MY ENCHANTMENT BURNINGLY WOOS YOUR PRECIOUS PASSION. YOU ARE MY PRECIOUS FELLOW FEELING, MY BREATHLESS FERVOUR, MY BURNING FERVOUR.

YOURS IMPATIENTLY,

M.U.C [242].

Любовное письмо из глубины времен! Конечно, Сильвия Дэй, главная мастерица наших дней по описанию страсти словами, может не бояться конкуренции со стороны загадочного M.U.C. (эти инициалы означают «Компьютер Манчестерского университета»). Автор, Mark 1 – первый поступивший в продажу компьютер общего назначения – чаще использовался для сложных математических вычислений. Любовные письма Стрейчи не были попыткой заменить Шекспира компьютером. Стрейчи работал и не забавы ради: он хотел понять, способны ли машины мыслить и испытывать чувства. Создание романов с помощью компьютеров интересно как раз тем, что помогает определить границы возможностей искусственного интеллекта.

Специалист по искусственному интеллекту Рэй Курцвейл, ставший директором Google по инженерным разработкам, предсказал, что к 2029 году компьютеры станут умнее всех людей, даже гигантов мысли. Чтобы это предсказание оправдалось, машины должны превзойти людей не только в области логики, но и в области эмоционального и творческого самовыражения. В том числе, конечно, – создания литературных произведений.

Многие удивляются, узнав, что большинство спортивных новостей и репортажей о бизнесе в СМИ сгенерировано компьютером. Крис Хэммон, директор по науке и соучредитель компании Narrative Science, утверждает, что компания сейчас занимается «гуманизацией машины… мы даем ей инструменты, которые помогут ей рассказывать нам истории». По его словам, компьютеры Narrative Science поставляют ежедневные рыночные обзоры в журнал Forbes, а также спортивные отчеты для канала Big Ten. Другая компания, Automated Insights, генерирует все отчеты по фондовому рынку на основе данных для новостного агентства Associated Press. Хэммон утверждает даже, что его машины постигли искусство маркетинга и умеют делать рассказ необъективным – именно таким образом, чтобы заслужить одобрение конкретной аудитории.

Однако написать роман, конечно, намного сложнее, чем сгенерировать биржевой отчет. Между автоматическим созданием текста и актом подлинного творения литературных произведений до сих пор лежит пропасть. Мы не сможем сказать, что компьютер теперь умеет и то и другое, пока машины не напишут историю человеческой любви, которая станет бестселлером.

Почему?

Многие согласятся: когда машина пишет о любви – это совсем не то же самое, что автоматическое генерирование новостных сводок на основе сухих фактов. Человеческая любовь (или, точнее, тема человеческой близости, крайне важная для бестселлера, как мы установили во 2-й главе) – самый интересный момент в дискуссии об отношениях человека и машины. Возможно, именно поэтому Стрейчи в 1952 году выбрал в качестве жанра любовные письма. Все знают книгу Филипа К. Дика «Мечтают ли андроиды об электроовцах?»[243] (1968) по экранизации 1982 года «Бегущий по лезвию». Фильм стал культовым – не в последнюю очередь потому, что среди его героев есть как люди, так и искусственные существа. Как они будут взаимодействовать? Может ли человекоподобный робот сойти за человека? В романе Дика и в фильме киборги способны выполнять человеческую работу, но человечность им чужда. Главным различием между настоящей и искусственной личностью, по Дику, является способность к эмпатии. Поэтому, хотя роман и приближает нас к стиранию границ между человеком и машиной, его обычно интерпретируют как еще одну иллюстрацию того, что люди слишком сложны эмоционально и духовно и никогда не станут продуктом фабричного производства. «Секретный ингредиент» человечества – высшее чувство, любовь, и формы его выражения – сострадание и способность чувствовать чужую боль.

Фильм Спайка Джонза «Она» (2013) – новый взгляд на ту же идею. Главный герой фильма Теодор зарабатывает себе на жизнь тем, что пишет личные письма для других людей. Он влюбляется в новую операционную систему своего компьютера – ее зовут Саманта, и она настолько совершенна, что способна имитировать любовь. Фильм интересен именно разработкой этой темы. Однако любовь заканчивается, когда машина решает бросить Теодора: она жертвует их близостью ради возможности философски исследовать свое существование и ускорить познание мира благодаря иному восприятию времени.

Возможно, вводя в сценарий этот разрыв, Джонз хотел продемонстрировать аудитории примерно то же, что и Дэйв Эггерс в «Сфере». По-видимому, и писатель, и сценарист полагают, что компьютеры будут становиться все совершеннее ради самого совершенства, и подлинные человеческие отношения будут принесены в жертву на кремниевом алтаре. Но для Теодора, страдающего из-за черствости электронной подружки, конец романа с компьютером знаменует возвращение его собственной, природной способности творить. Мы впервые видим, как он пишет прочувствованное письмо для себя – не по работе, не ради денег, а от своего имени, к бывшей жене. Значит, и фильм «Она», и роман Филипа Дика можно трактовать как заявление о непреодолимой пропасти между людьми и машинами.

Следовательно, человеческая близость – тема, интересная не только как фактор успеха книги, но и как направление исследований в области ИИ и компьютерного письма. Однако она же служит индикатором провала эксперимента. Первая попытка написания романа компьютером, признанная удачной, была предпринята в 2008 году, еще до знаменитого твита Каземи. Роман назывался «Настоящая любовь. wrt» (True Love.wrt), его сгенерировала программа, созданная российскими программистами. Видимо, поэтому все имена героев взяты из «Анны Карениной» Толстого. Авторы программы дали ей в качестве исходных данных «Каренину», семнадцать современных романов, написанных на русском языке, и один переведенный с японского. Стиль – характеристики героев и строение предложений – был позаимствован у японского писателя Харуки Мураками, чьи книги стали бестселлерами.

Неявно подражая Толстому и Мураками, программа создала вполне сносный текст. Описания в нем выглядят примерно так:

Заходящее солнце окрасило бледно-розовым цветом подбрюшья облаков, низко нависших над серой водой. Кое-где еще виднелись белые барашки, но было ясно, что шторма, которого они ожидали весь день, не будет.

А вот пример описания внутренней жизни персонажа:

Китти долго не могла уснуть. Нервы ее были напряжены, как две тугих струны, и даже стакан горячего вина, который Вронский заставил ее выпить, не помог. Лежа в постели, она снова и снова возвращалась мыслями к чудовищной сцене на лугу.

Многих редакторов передернет от сравнения нервов с тугими струнами, но, если честно, мы видели тексты и похуже, причем от писателей-людей. Радует уже то, что компьютер смог использовать метафору и что все эпитеты имеют смысл. «Драгоценное братское чувство» из любовного письма M.U.C. выглядит смешно, а вот «горячее вино» смотрится вполне нормально, и «чудовищная сцена» – тоже. Это явный прогресс. Впрочем, нельзя сказать, что роман читается на одном дыхании. Все герои говорят одним и тем же голосом, примерно одинаково построенными фразами. Очень трудно создать такую программу, которая бы моделировала индивидуальности.

Публикуя книгу, российское издательство надеялось, что она станет сенсацией – новаторским прорывом в этой области. Журналисты шутили, что наконец-то издательствам не нужно будет терпеть непунктуальных авторов, запаздывающих со сдачей рукописи, внезапно ушедших в декрет или в запой. Но те, кто прочитал сам роман, были не столь оптимистичны. По совести следует сказать, что превосходством над неуклюжими любовными письмами роман обязан не столько огромному прогрессу в области ИИ и компьютерных эмоций, сколько писателям, которых копирует программа. Подобные романы могут быть только подделкой. Подделка может быть более удачной и менее удачной, коллажи из чужих книг – забавными или не очень, но все равно подделка (как и вторичная переработка чужого сырья) – это не творчество.

Программа Каземи под названием «Content, Forever» позволяет пользователю ввести стартовую, исходную тему (например, «любовь» или «смерть»). Программа ищет статью на это слово в Википедии и копирует часть текста из первых нескольких абзацев. Затем ищет в статье ссылки и переходит по ним. Берет часть текста и с этих страниц и складывает вместе, так что получается нечто вроде потока машинного сознания.

Подобными вещами занимались дадаисты, представители авангардного течения в искусстве, еще в 20-х годах прошлого века. А метод, известный как «метод нарезок», популяризировал романист из поколения битников Уильям С. Бэрроуз в 50-х. Суть метода объясняется его названием. Газеты или другие печатные материалы режутся на отдельные слова и фразы, которые затем переставляются для достижения нужного эффекта, иногда без оглядки на смысл и связность. Странные сочетания слов создают новый смысл и визуальный эффект. Позже этот метод использовался при монтаже кинофильмов, записанной речи и музыки. Дэвид Боуи, Майкл Стайп и Том Йорк из группы Radiohead – все они использовали тексты песен, созданные методом нарезки.

Поэтому вряд ли можно утверждать, что программа, создающая роман методом нарезки (или сама идея создания такого романа) представляет собой что-то новое и оригинальное. Трудно также поверить в то, что результат захватит читателя, дав ему пищу для ума или сердца. Писателей учат писать о том, что они хорошо знают, и черпать идеи из собственного жизненного опыта. Если же в качестве источника идей выступает Википедия, можно создать разве что документальные книги и справочники – захватывающей художественной прозы на таком материале не получится, ведь творение книги – это в том числе путешествие в глубину души писателя, а не только череда приключений во внешнем мире.

В 2013 году Ник Монфорт принял участие в NaNoGenMo, и написанная им программа сгенерировала роман под названием «World Clock» – «Всемирные часы». Программа интересна тем, что содержит всего 165 строк кода на языке программирования Python. Роман был опубликован в издательстве при книжном магазине Гарвардского университета. При взгляде на код становится ясно, что он, как и другие подобные программы, – просто конвейер для сборки слов в предложения. Он выдает бесконечную цепочку похожих абзацев, с минимальными вариациями. В каждом абзаце три предложения; первое всегда начинается со слова «сейчас» и указания на время в определенной точке земного шара, второе – со слов «в каком-то», а третье – с местоимения «он» или «она». Пожалуй, авторам бестселлеров, которые мы обсуждали на страницах этой книги, и даже второразрядным писателям не стоит бояться конкуренции. Получившийся текст – унылее самых убогих школьных сочинений. Впрочем, вряд ли кто-то будет утверждать, что читает «Всемирные часы» ради красоты слога.

Так в чем же суть этого явления? В конечном счете вся привлекательность «Всемирных часов» и аналогичных романов состоит в том, что их написала машина. Интерес общества к этим проектам пока вызван их новизной и забавностью, а не заботой о будущем художественной литературы. Мы читаем тексты, написанные компьютером, из-за случайно возникающих абсурдно-ироничных сочетаний. Если из машинных творений и можно извлечь какую-либо общую истину, то разве что мысль о нехватке искренности и смысла в мире, где царствуют технологии. Конечно, и эта идея кому-то окажется близка, но лучше не увлекаться такими текстами. Наша культура действительно перенасыщена технологиями, но дело писателя – не генерировать абсурд, а создавать смысл или отыскивать его в окружающем хаосе. Такова одна из задач литературы. Если компьютеры и становятся умнее людей, то их ум следует измерять объемом накопленной информации. Но ум писателя – иной, его мастерство заключается в умении творить и критически мыслить. Компьютерные произведения выглядят убого по сравнению с обычной художественной литературой. Они хороши только местами. Возможно, так и будет выглядеть в конце концов компьютерное творчество – небольшие отрывки, призванные развеселить нас.

Поскольку мы занимаемся компьютерным анализом текстов, нас часто спрашивают, не хотим ли мы заняться и компьютерным литературным творчеством. Конечно, мы задумываемся, на что оказалась бы способна компьютерная программа, имей ее авторы доступ ко всем данным, накопленным нами при исследовании бестселлеров. Мы научили компьютер обнаруживать и измерять присутствие нескольких тысяч элементов, необходимых для того, чтобы книга стала бестселлером. Интересно было бы взять все эти данные и разработать новые скрипты, которые генерируют романы на основе наших наборов переменных.

У такого романа явно больше шансов понравиться читателям, чем у других творений машины. Однако нам это неинтересно. Ведь в любом случае новый текст будет создан на основе существующего – или работ живых писателей (как Настоящая любовь. wrt), или текстов, лежащих в свободном доступе в интернете (как книга Каземи), или же личного опыта самих программистов. В последнем случае они должны будут дать машине такие подробные инструкции, что, по совести, компьютер уже нельзя будет назвать автором получившегося текста. Мы предпочли бы просто сесть за стол вдвоем, вооружиться бумагой и ручкой и попробовать самим написать роман на базе своих изысканий.

Постскриптум, или Некоторые подробности о методе

Несколько предупреждений. Этот постскриптум задуман как простой мостик – не мост Риальто и не Понте-Веккьо, а простой мостик, вроде доски, перекинутой через овраг, – между миром художественной литературы и миром компьютерного анализа текстов. То, что вы прочитаете дальше, не предназначено для специалистов по компьютерным наукам, преподавателей или техников из издательства. Здесь не будет программного кода для анализа эмоций в романах. Вы также не найдете здесь пошагового руководства «Как построить собственный бестселлерометр в домашних условиях». Для тех, кто интересуется компьютерными науками, есть множество учебников и научных статей, из которых можно научиться как основам, так и более сложным методам анализа текстов. Аналогичным образом эти заключительные страницы не предназначены для страстных любителей чтения или будущих писателей. Вы увидите несколько примеров выданной компьютером информации и рассказ простыми словами о таких вещах, как синтаксический разбор, машинное обучение, распознавание именованных сущностей. Это – упрощенное введение в методы, использованные для получения результатов, которые легли в основу нашей книги.

В методе, который мы использовали для классификации книг, есть два основных понятия, соответствующие двум основным стадиям общего процесса анализа. Эти термины – «интеллектуальный анализ текста» и «машинное обучение» – часто используются как взаимозаменяемые, и во многих аспектах они взаимозависимы. Для осмысленного анализа текста часто требуется сначала обучить машину, а для обучения машины нужна некоторая информация из текста. Но в данном случае мы хотим разграничить эти два понятия. «Интеллектуальный анализ текста» мы будем понимать в узком смысле – как процесс поиска и извлечения определенных параметров из текста книги. Это будет наш первый шаг. «Машинное обучение» можно определить (также в узком смысле) как способ обработки полученных параметров, на основе которых будет сделан вывод о том, принадлежит ли книга к группе бестселлеров. Это второй шаг. Чтобы довести обе части процесса до удовлетворительного состояния (то есть до такого, который позволил нам с уверенностью представить «Сферу» как образцовый пример наиболее вероятного бестселлера), нам понадобилось около четырех лет и несколько тысяч компьютеров.

Интеллектуальный анализ текста

Компьютеры могут читать текст самыми разными способами – деталями этого процесса занимается отдельная дисциплина, обработка естественного языка. Существуют мощные программы для извлечения данных из текстов. Базовые задачи при анализе естественного языка – выделение слов, идентификация предложений, разбор по частям речи и разбор зависимостей. В каждой из этих задач есть свои сложности, так что «базовый» в данном случае не значит «простой». Решение этих задач лежит в самой основе нашей работы, описанной в этой книге.

Что такое разбиение на слова? Попросту говоря, компьютер учат находить начало и конец каждого слова. На первый взгляд может показаться, что это очень просто: где пробел – там заканчивается одно слово и начинается следующее. Часто так оно и есть. Но для интеллектуального анализа текста этого «часто» – недостаточно: всегда существуют граничные случаи, усложняющие жизнь. Посмотрите на предыдущее предложение. После слова «недостаточно» стоит двоеточие. Оно не является частью слова, поэтому нельзя приказать компьютеру разбивать слова только по пробелам. Компьютеры должны знать, что «хорошо» – это слово, а двоеточие – знак препинания. Посмотрим теперь на английское слово doesn’t. Это сокращение от does not[244]. Как вы думаете, doesn’t – это одно слово или два? Если одно, то придется объяснить компьютеру, что апостроф – не такой знак препинания, как двоеточие в предыдущем примере, и что его следует трактовать как заменитель буквы. А как насчет can’t[245] или притяжательной формы Robert’s? Компьютеру бывает сложно разобраться в этих и других причудах словоупотребления. Впрочем, это и людям иногда сложно. Мы спросили своих студентов, что такое can’t – одно слово или два. Половина ответила, что одно, а половина – что два, имея в виду, что это сокращение от can not. Еще бывают сложные слова, которые иногда пишутся в два слова, иногда – в одно, а иногда – через дефис. В ходе работы над этой книгой мы раз пять обсуждали написание одного и того же слова: bestseller. Как его следует писать – bestseller или best-seller? Оно образовано от глагола bestsell, но с этим глаголом возникает тот же вопрос. Сокращения и сложные слова отчасти подобны коту Шредингера: они существуют в двух состояниях одновременно.

Значит, даже такая вроде бы простая задача, как разбиение на слова, оказывается весьма нетривиальной, если углубиться в детали языка и грамматики. Специалисты по обработке естественного языка подходят к этому вопросу так: они пишут программы, которые сначала вычленяют слова в тексте, а затем предлагают несколько вариантов обработки сокращений, слов с заглавной буквы и т. п. При исследовании современных бестселлеров нам все время приходилось принимать решения именно по таким вопросам. В конце концов оказалось, что на них можно отвечать по-разному для разных задач. Например, при анализе стиля, о котором мы говорили в 4-й главе, мы решили игнорировать заглавные буквы – таким образом, с точки зрения компьютера The и the было одним и тем же словом. Мы пренебрегли возможной разницей между ними. Но мы могли бы пойти и другим путем, попросив компьютер трактовать их как два разных слова, и тогда, возможно, узнали бы что-нибудь очень полезное. The с заглавной буквы будет, скорее всего, стоять в начале предложения. В 5-й главе мы показали, какую важную роль играет The в заглавиях романов. А что, если авторы бестселлеров начинают большее количество предложений со слова The? Мы решили анализировать это слово так, как если бы оно всегда было написано с маленькой буквы. Возможно, в результате мы пропустили какую-то важную стилевую особенность бестселлеров.

Определять, где начинаются и кончаются предложения, – еще одна непростая задача для компьютера. В конце предложения обычно стоит точка, вопросительный или восклицательный знак. Начало предложения обычно отмечено заглавной буквой. Руководствуясь этими принципами, наши компьютеры, как правило, верно распознают границы предложений. Можно написать компьютерную программу, которая использует простой алгоритм, например:

Начать с первого слова и идти по тексту, пока не попадется точка, вопросительный или восклицательный знак. Если следующее слово после точки, вопросительного знака или восклицательного знака начинается с большой буквы, значит, здесь конец предложения и начало следующего.

Но что будет, если ваша программа наткнется на предложение вроде такого: I was surprised to hear that Dr. Archer was writing a novel[246]. В этом предложении есть точка (после слова Dr.), а следующее за ней слово начинается с большой буквы (Archer). Руководствуясь только что сформулированным правилом, компьютер решит, что здесь конец предложения, и ошибется. Из-за этой и других проблем, связанных с сокращениями, при распознавании предложений нельзя ограничиться правилом о знаках препинания и заглавных буквах. Есть и другие сложности. Возьмем абзац текста с прямой речью:

After a long day spent training the machine to read bestsellers, Matt called Jodie and said, “Dialog will be the death of me.” Jodie offered solace in the form of Scotch whisky[247].

В этом случае точка, отмечающая конец предложения, попала внутрь кавычек. Чтобы разобраться в подобной ситуации, нашему компьютеру понадобится еще одно правило, специально для работы с кавычками. К тому же, оказывается, это правило нужно только для прозы, написанной американскими и канадскими авторами. В британском и австралийском английском кавычки принято помещать перед знаками препинания. Учитывая природную гибкость языка, легко вообразить себе множество исключений из этих общих правил. В общем, вы уже поняли: даже самые простые действия по извлечению параметров из текста очень сложны.

По этой причине многие специалисты по обработке естественного языка в частности и интеллектуальному анализу текстов вообще переходят от разбора на основе правил к методам, основанным на статических выводах. Вместо того чтобы перебирать все возможные способы создания предложений и пытаться сформулировать огромный набор правил с массой исключений для различных случаев, статистический подход изучает скрытые законы, управляющие языком, – их извлекают компьютеры, рассчитывая вероятности появления различных конструкций и комбинаций в реальных текстах.

Хороший пример этого процесса – автоматизированный разбор по частям речи. Во 2-й главе мы писали о том, как изучение существительных помогает выявить темы книги. Но прежде чем применить алгоритм моделирования тем, нам пришлось научить компьютер распознавать существительные. Слово hope[248], например, может быть существительным:

He held out hope that she would buy the book herself[249].

Оно может быть и глаголом:

She hoped he would buy her the book[250].

И даже именем собственным:

Hope told him to buy the book himself[251].

Современные алгоритмы разбора знают, где существительные, где глаголы и т. д., и умеют различать все соответствующие оттенки смысла. Алгоритмы смотрят на контекст всего предложения и делают выводы о том, к какой части речи принадлежит то или иное слово, на основе его места в предложении и контекста.

Введя эти предложения в программу разбора по частям речи, мы получаем на выходе примерно следующее:[252]

He/PRP held/VBD out/RP hope/NN that/IN she/PRP would/MD buy/VB the/DT book/NN herself/PRP./.


She/PRP hoped/VBD he/PRP would/MD buy/VB her/PRP the/DT book/NN./.


Hope/NNP told/VBD him/PRP to/TO buy/VB the/DT book/NN himself/PRP./.

Заглавные буквы после косой черты – сокращенные обозначения частей речи. Слово hope было правильно опознано в первом предложении как существительное (NN), во втором – как глагол (VBD), а в третьем – как имя собственное (NNP). Для размеченного таким образом текста легко написать программу, которая извлечет только существительные, помеченные NN. Так мы получим существительные – кирпичики, из которых строится фундамент: опираясь на них, компьютер выделяет из текста темы.

Исследователи используют разные способы обучения компьютеров распознаванию частей речи. Но в большинстве этих способов задействован обширный корпус предложений, уже размеченных людьми. Специалисты по грамматике часами сидят над текстами, помечая части речи, а затем эти размеченные предложения загружают в программу в качестве обучающих данных. На основе этих данных машина строит статистическую модель, которая вычисляет вероятность появления той или иной комбинации слов. Например, компьютер может заметить, что после слова the в 55 % случаев стоит существительное, в 40 % – прилагательное и в 5 % – числительное. Конечно, такие программы разбора тоже иногда ошибаются, но очень редко – так редко, что, по мнению некоторых исследователей, задача компьютерного разбора по частям речи «уже решена». Другие исследователи возражают, но не слишком активно. Программа разбора по частям речи, разработанная в Стэнфордском университете, работает с точностью 97–100 %. Такая точность, безусловно, годится для большинства задач анализа текстов – в том числе тех, что мы решали при исследовании бестселлеров.

Распознавание именованных сущностей (NER) – другая область обработки естественного языка, тесно связанная с нашими исследованиями. Именованная сущность – это человек, географический объект или организация: Лисбет Саландер, Нью-Йорк, Microsoft. Распознавание подобных грамматических объектов позволяет находить ответы на разные вопросы – например, влияет ли место, где происходит действие романа, на факт его попадания в списки бестселлеров? Мы, разумеется, задались этим вопросом и обнаружили следующее: для того, станет ли роман бестселлером, важно, происходит ли действие в городе или где-нибудь в лесу. Конкретный город не важен. Роман, герои которого живут в Нью-Йорке, имеет столько же шансов, сколько и роман, герои которого живут в Стокгольме.

В 5-й главе мы использовали NER для лучшего понимания героев книг и исследования их агентивности. Но еще важнее для изучения персонажей оказался метод, называемый разбором зависимостей. Программы для разбора зависимостей анализируют предложение и размечают его синтаксическую структуру. Программа разбора понимает, какие слова связаны между собой и где в предложении подлежащее, сказуемое и дополнение. Как и описанный выше алгоритм разбора по частям речи, эта программа использует информацию из предложений, предварительно разобранных специалистами-людьми. Эта информация помогает определять наиболее вероятную структуру введенных в программу предложений. Для 5-й главы нам нужно было исследовать агентивность героев на основе глаголов, обычно связанных с мужскими и женскими персонажами[253]. Возьмем, например, это предложение из «Сферы»:

Mae knew Renata was watching her, and she knew her face was betraying something like horror[254]. Пропустив это предложение через программу разбора зависимостей, получаем на выходе следующее:[255]

nsubj(knew-2, Mae-1)

root(ROOT-0, knew-2)

nsubj(watching-5, Renata-3)

aux(watching-5, was-4)

ccomp(knew-2, watching-5)

dobj(watching-5, her-6)

cc(knew-2, and-8)

nsubj(knew-10, she-9)

conj(knew-2, knew-10)

nmod: poss(face-12, her-11)

nsubj(betraying-14, face-12)

aux(betraying-14, was-13)

ccomp(knew-10, betraying-14)

dobj(betraying-14, something-15)

case(horror-17, like-16)

nmod(betraying-14, horror-17)

Первая строка вывода показывает связь подлежащего (Mae)[256] с основным глаголом (knew)[257]. Кстати сказать, цифры рядом со словами показывают их порядок в предложении: Mae – первое слово, knew – второе, затем идет Renata и т. д. Обратите внимание: программа заметила связь между Ренатой, другим персонажем романа и глаголом watching[258], а также между местоимением she и вторым вхождением глагола knew. Объединив результаты анализа зависимостей и данные об именах персонажей, полученные с помощью NER, мы смогли понять, какие глаголы характерны для того или иного персонажа. Например, в этом предложении Мэй знает, а Рената наблюдает.

Из всех задач, с которыми мы столкнулись в ходе исследований, разбор зависимостей требует наибольшего объема вычислительных мощностей. Обработка одного романа занимает до пятнадцати часов, а романов у нас были тысячи. К тому же после разбора нужно было пройти по всем текстам еще раз, чтобы извлечь интересующие нас сочетания подлежащего и сказуемого. Это настолько трудоемкий процесс, что нам понадобился кластер из тысячи компьютеров, чтобы обрабатывать тысячу книг одновременно.

С точки зрения сложности вычислительных задач самой простой, вероятно, была описанная в 3-й главе – построение сюжетных графиков на основе слов, означающих эмоциональное состояние героев. Ученые, работающие в этой области (она называется «анализ тональности текста»), разработали несколько подходов к исследованию слов, обозначающих эмоции. Самые совершенные из этих методов делают выводы на основе статистических данных – примерно так же, как и программы разбора по частям речи и разбора зависимостей. Сейчас эти методы используются для анализа отзывов потребителей о товарах и услугах, а также для определения общего эмоционального настроя различных текстов, в том числе электронных писем. Мы экспериментировали с разными методами анализа тональности, но оказалось, что для выделения эмоционально нагруженных слов из текста более простые методы работают лучше.

В методе, который мы сочли наиболее эффективным, использовалось несколько специальных словарей, содержащих эмоционально окрашенные слова. Эти «словари эмоций» представляют собой просто списки слов, для которых указана эмоциональная окраска (положительная или отрицательная) и «валентность». Например, слово «любить» имеет сильную положительную окраску, а «ненавидеть» – сильную отрицательную. Мы научили программу читать книгу слово за словом, регистрировать эмоциональную окраску каждого, а затем давать оценку всему предложению. Последовательности позитивно и негативно окрашенных предложений и создают кривые графиков, приведенные в 3-й главе. Возьмем фразу из речи Эймона в «Сфере»: «Я люблю вас, как трава росинку, как птица ветку». Такое предложение алгоритм определит как положительно окрашенное. Вот еще одна фраза из «Сферы» – ее произносит Энни, только что узнавшая, что ее предки были рабовладельцами: «Ты вообще представляешь, какой бардак сейчас у нас в семье?» Неудивительно, что эту фразу алгоритм пометит как окрашенную отрицательно. Количество положительно и отрицательно окрашенных предложений в отрывке текста, как правило, отражает состояние главного героя в текущий момент и показывает, в каком месте сюжета мы находимся.

Все процессы интеллектуального анализа текста, которые мы обсуждали до сих пор, имеют дело с выделением и распознаванием отдельных компонентов текста. После вычленения слов уже легко узнать, как часто каждое из них встречается. Определив границы предложений, можно подсчитать, например, среднюю длину предложения или соотношение объема диалогов с объемом остального текста. Выполнив разбор по частям речи, мы можем исследовать типы существительных, прилагательных и глаголов, используемых разными авторами. Можно даже начать искать закономерности, характерные для одних писателей и отсутствующие у других. Извлеченные существительные можно ввести в алгоритм моделирования тем (как было показано во 2-й главе), а результаты разбора зависимостей позволяют нам исследовать синтаксис предложений и увидеть, какие связки «подлежащее – сказуемое» используются в каждой книге.

Вся эта вычислительная работа – на самом деле лишь подготовка. Обычно ее называют «предобработкой», предшествующей выделению и извлечению параметров текста. Лишь исследовав различные методы извлечения интересующих нас параметров, можно переходить к более интересной работе – использованию этих методов для классификации книг. Эта вторая фаза построения бестселлерометра называется машинным обучением.

Машинное обучение

Машинное обучение – это фильтрация данных, извлеченных на стадии анализа текста. На первой стадии исследований, положенных в основу этой книги, мы проверили 28 000 параметров, чтобы понять, какие из них имеют ценность в построении прогнозов успешности. Это было необходимо для экспериментов по обучению компьютера классификации книг. Мы трудились долго и в итоге отсеяли тысячи характеристик. В конце концов мы пришли к базовому набору из 2799 параметров, которые, по нашему мнению, действительно позволяют предсказать успех книги. Так что мы сбросили со счетов «Нью-Йорк» и «Стокгольм», игнорировали числа в заглавии («1984» и «1 000 000»), но отметили ценность темы человеческой близости (глава 2), глаголов need и want (глава 5) и сокращений типа I’m и couldn’t (глава 4). Важность этих характеристик мы смогли понять благодаря алгоритмам машинного обучения.

Основная идея классификации, к которой мы пришли в ходе исследования, очень проста. Мы начали с предположения, что книжный мир – «черно-белый»: существуют только два типа книг – те, что попали в список бестселлеров NYT, и те, что не попали[259]. Затем мы сравнивали параметры книг, попавших и не попавших в список, из нашего корпуса текстов. Первой задачей было просто сравнить их и понять, есть ли между ними существенная разница. Если разница есть (допустим, оказалось, что слово and в бестселлерах встречается в два раза чаще, а слова very и passion гораздо реже по сравнению с прочими книгами) – значит, этот параметр полезен. Частота употребления отдельных слов – конечно, очень простой пример, и читатели едва ли обращают на нее внимание, но, собрав отдельные слова и грамматические конструкции в темы и построив сюжетные графики, мы получим важные, информативные данные.

В своих исследованиях мы использовали три разных алгоритма компьютерной классификации книг. Все эти алгоритмы начинают с определения места каждой книги в так называемом пространстве параметров. Количество измерений этого пространства равно количеству параметров, которые мы хотим исследовать. Иными словами, оно огромно. Поскольку людям сложно представить себе многомерное пространство, допустим, что бестселлерометр оперирует только двумя параметрами. Возьмем для примера две из 2799 характеристик, выделенных нами как важные: тему человеческой близости и частоту употребления слова very. Для каждой книги модель выдаст нам два числа – одно из них показывает долю темы человеческой близости, другое – частоту слова very. Используя эти числа, мы можем отобразить каждую книгу на координатной плоскости, которая в итоге будет выглядеть примерно так, как показано на рис. 18. Каждый значок на плоскости – один роман, а его координаты заданы этими двумя показателями.


Рис. 18


Посмотрев на график, вы заметите, что бестселлеры группируются в правом нижнем углу. Иными словами, график сообщает нам, что в бестселлерах тема человеческой близости встречается чаще (показано координатой по оси х), а слово very – реже (показано координатой по оси у). Если вы внимательно читали нашу книгу, то уже знаете это из глав о темах и стиле. Возможно, вы даже помните, что really[260] – слово более полезное, чем very, для того чтобы попасть в список бестселлеров. Мы считаем, что это позволяет сделать определенные выводы о современной тональности текста и манере выражения. Вас не удивит и то, что треугольнички сбились в кучу в левом верхнем углу: авторы этих книг уверяют вас, что очень то и очень сё, но их описания человеческих отношений не очень убедительны.

Первый метод классификации, который мы использовали, известен как «K ближайших соседей» (K Nearest Neighbors, KNN). Работа метода KNN начинается с размещения книг в пространстве параметров (примерно как на графике выше). Мы как исследователи затем решаем, чему должно быть равно К. Допустим, мы решили, что оно равно 5. Алгоритм KNN начинает классификацию книги с того, что берет пять ее ближайших соседей в пространстве. Если большинство из этих пяти книг оказываются бестселлерами, компьютер делает вывод, что исследуемая книга – тоже бестселлер, поскольку ее соседи обладают характеристиками, позволяющими попасть в заветный список. Обратите внимание на рис. 19: один бестселлер расположен заметно ближе к кластеру небестселлеров, занявшему верхний левый угол. В этом случае алгоритм KNN посмотрит на ближайшие пять книг и сделает неверный вывод, что эта книга – не бестселлер, поскольку четыре из ее пяти соседей тоже не бестселлеры. На рис. 19 область, в которой расположены соседи данной книги, показана окружностью.


Рис. 19


Все остальные бестселлеры в этом искусственно сконструированном примере будут классифицированы правильно на основании класса пяти книг, непосредственно соседствующих с ними. Единственный небестселлер, расположенный ближе всего к правому нижнему углу, будет неправильно классифицирован как бестселлер, поскольку среди пяти ближайших к нему книг есть три бестселлера и два небестселлера. Теперь вы понимаете, почему средняя точность предсказаний нашего бестселлерометра равна 80 %.

Два других использованных нами алгоритма несколько сложнее, чем KNN. Они называются «машины векторов поддержки» (Support Vector Machines, SVM) и «ближайшие сжатые центроиды» (Nearest Shrunken Centroids, NSC). Второй из них разрабатывался первоначально для классификации типов рака на основе данных экспрессии генов, а мы решили использовать его для своих целей. Подобно KNN, алгоритмы SVM и NSC также используют размещение книг в многомерном пространстве параметров. Определив положение каждой книги в этом пространстве, алгоритм SVM пытается найти максимальный зазор между заведомыми бестселлерами и заведомыми небестселлерами. Этот зазор или граница может выглядеть примерно как на рис. 20[261].

Когда в то же пространство помещают новую книгу, ее можно отнести к бестселлерам или небестселлерам в зависимости от того, с какой стороны от границы она окажется.

Алгоритм NSC концептуально близок к KNN и SVM. Он начинает работу с определения позиции всех книг в пространстве параметров, а затем находит математические центры множества всех бестселлеров и множества всех небестселлеров – «центроиды». Затем используется пороговый параметр, чтобы их сжать. Неизвестная книга классифицируется на основании того, к какому из сжатых центроидов она окажется ближе[262].


Рис. 20


На основании 2799 параметров лучшая из наших трех моделей (KNN) смогла правильно отличить бестселлер от небестселлера в 90 % случаев[263]. Худшая из трех моделей (SVM) угадывала правильно только в 70 % случаев. У NSC показатель был примерно посередине – 79 %, но NSC значительно превосходит KNN в удобстве интерпретирования результата, предоставляя массу интересных данных о том, какие параметры оказались наиболее полезными в выявлении различий между двумя классами книг. В среднем точность трех методов была равна 80 %, и мы использовали все три для «коллективного» предсказания судьбы каждой из книг в нашем корпусе текстов.

Вас, вероятно, интересует, как мы вывели эти процентные соотношения. Мы начали с двух групп книг – бестселлеров и небестселлеров. Мы наблюдали за работой модели на этих двух множествах. Для этого мы сначала обучили модель на случайно выбранном подмножестве книг. Компьютер использовал эту выборку, чтобы понять, какие параметры отличают бестселлеры от небестселлеров. Затем мы заставили компьютер классифицировать на основании полученной информации все книги, которые не использовались на этапе обучения. Компьютер сделал прогноз по поводу каждой из них. Обратите внимание, что на этой стадии компьютеру не была известна подлинная судьба текстов. Затем мы сравнили прогноз компьютера с реальной судьбой книги. Этот процесс (называемый перекрестной валидацией) придал нам уверенность в успехе проекта. Мы использовали два подхода. Для первого (так называемой десятикратной перекрестной валидации) компьютер выбирал случайным образом 10 % бестселлеров и 10 % небестселлеров и изымал их из множества. Затем модель обучалась на оставшихся книгах, и качество обучения проверялось классификацией первоначально изъятой выборки. Процесс случайного выбора книг и построения модели повторяется снова и снова, и после каждой валидации точность предсказания регистрируется. Затем рассчитывается средняя точность предсказания по всем попыткам[264].

Второй метод перекрестной валидации называется «за вычетом одной». Как ясно из названия, он состоит в том, что из корпуса текстов единовременно изымается только одна книга. Затем строится модель на основе всех оставшихся. Изъятая книга предъявляется модели для вынесения вердикта. Вердикт регистрируется. Затем из корпуса текстов изымается другая книга, и процесс повторяется до тех пор, пока все книги в корпусе не будут по очереди изъяты и классифицированы[265]. Это долгий процесс, требующий необычайной аккуратности; правду сказать, работа по построению и испытанию модели вообще была гораздо более кропотливой, чем может показаться по краткому описанию. Поскольку небестселлеров в нашей коллекции было намного больше, чем бестселлеров, мы проводили два типа экспериментов.

В некоторых из них количество книг было сбалансировано так, чтобы уравнять число представителей каждого класса. В таких экспериментах модель случайным образом выбирала подмножество небестселлеров из всех небестселлеров нашей коллекции. Таким образом, модель обучалась на множестве, в котором было поровну бестселлеров и небестселлеров. Этот подход позволяет гарантировать, что при случайном выборе книга может с равной вероятностью оказаться тем и другим.

Кроме экспериментов, в которых контролировалось число книг каждого класса, мы реализовали процедуру «контроля авторов», гарантирующую, что чересчур плодовитые писатели не получат несправедливого преимущества. При работе с методом «за вычетом одной» мы конфигурировали эксперимент так, чтобы в обучающих данных не было других книг того же автора. Если бы не это, авторы серий, такие как Гришэм, Паттерсон и Стил, получили бы фору. Но при таком дизайне эксперимента их шансы были равны шансам любого другого писателя.

Только начав работу с обучающейся моделью, несколько лет назад, мы проверили гипотезу Джоди о том, что у всех бестселлеров есть что-то общее в генотипе. Для этого мы работали с тысячами книг, выпущенных до 2010 года. Мы хотели построить модель, которая надежно классифицирует книги, исключает отклонения и дает специалистам по книжному делу полезные данные, которые легко интерпретировать. Результаты построения первой модели нас впечатлили. Затем мы несколько лет наблюдали за книжным рынком. К примеру, в коллекции, на которой обучалась наша первая модель, не было ни «Пятидесяти оттенков серого», ни «Исчезнувшей». Нам нужно было узнать, что скажет наша модель об этих новых книгах – правильно ли она их классифицирует. Конечно, если вы прочитали 3-ю и 5-ю главы нашего труда, то уже знаете, что компьютер отлично справился с этой задачей и что из его классификации мы многое узнали о сюжете и персонажах. Мы постоянно обучаем модель и обновляем корпус текстов, когда на рынке появляется новая Э. Л. Джеймс или новый пулитцеровский лауреат. Но на данном этапе можно сказать, что это происходит скорее для утоления нашего любопытства, чем для усовершенствования алгоритмов. За последние несколько лет мы прилагали все силы, чтобы включить в модель сведения о новых тенденциях – моде на сюжеты, изменениях в литературном стиле и т. д. Конечно, так поступать велит нам этика исследователей. Но вот что нас сначала поразило, а теперь приводит в восторг: компьютер не теряется, когда ему предъявляют нашумевшие новинки. Мы боялись, что он не сможет классифицировать «Пятьдесят оттенков серого» со всеми ее описаниями секса, или «Девушку с татуировкой дракона» – книгу с героиней нового типа. Но компьютер оказался молодцом.

Правильная классификация нашей моделью таких «аномалий» рынка, как «Пятьдесят оттенков» или очень непохожего на нее, но тоже опубликованного силами автора романа «Хижина» заставила нас задуматься о том, что, может быть, новых сюжетов в самом деле не существует. Если мы и пришли в результате своего эксперимента к какому-либо глобальному выводу, он состоит в том, что не нужно беспокоиться о моде и духе времени в литературе. Мы убедились в правильности старой идеи о том, что сюжетов на свете мало – можно по пальцам перечесть, и их лишь переделывают и пересказывают по-новому: порой этот рассказ бывает более эффектным, а порой – менее. Поэтому читатели, обманутые невиданной оберткой, удивляются и будут удивляться сюрпризам – но нашу модель не обмануть. Новая тема или новый тип героя, из-за которого поднялась шумиха в прессе, – лишь малая часть генотипа книги. В частности, то, что наша модель правильно классифицировала «Пятьдесят оттенков», означает: даже если тема БДСМ впервые появилась в списке бестселлеров благодаря Э. Л. Джеймс, все остальные аспекты ее книги были для этого списка отнюдь не новы. Всяческие плетки и повязки на глаза – лишь вишенка на торте, а может – удачная уловка автора, которому удалось правильно соединить менее очевидные компоненты бестселлера, вплоть до запятых и глаголов, для достижения успеха. То же верно в отношении Ли Чайлда, Николаса Спаркса, Дэйва Эггерса, Тони Моррисон и вообще всех авторов из списка книг, рекомендованных нашим компьютером.

Надеюсь, читая их, вы получите такое же удовольствие, какое получили мы.

Выражения благодарности

Оба автора, когда хотят поблагодарить кого-нибудь, скорее склонны пригласить этого человека на бокал вина или даже прийти к нему в гости с бутылкой. Но при написании этой книги мы поняли, что любой уважающий себя автор имеет множество обязанностей, которыми просто нельзя пренебречь. Одна из них – вставить в книгу страницу, на которой должным образом выражается благодарность. Итак: спасибо, Дон Фер и его сотрудники в Trident Media Group. Спасибо, Даниэла Рэпп и ее сотрудники в издательстве St.Martin’s Press в Нью-Йорке. Спасибо, Лора Стикни и ее сотрудники из Penguin Press в Лондоне. Спасибо, Аарон Домингес и Эмели Харстад из Университета Небраски. Спасибо, Андреа Лансфорд, Рамон Салдивар и Сианн Нгай из Стэнфордского университета. Спасибо, Габи Кириллофф, Ёчжин Ким и Марк Бессен. Спасибо, Бриджет Флинн, Джанет Уорхэм, Мэттью А. и Одри Джокерс. Спасибо, Роб Макдональд. Спасибо, Стивен и Дженни Уайтхед. Спасибо, Элизабет Вуд и Дэн Пауэрс. Спасибо и вам, Боди Мэк.

Все вы (кроме детей) можете в любое время явиться за причитающимся вам бокалом вина.

Сноски

1

Luftslottet som spr?ngdes, Stieg Larsson.

(обратно)

2

M?n som hatar kvinnor, Stieg Larsson.

(обратно)

3

Flickan som lekte med elden, Stieg Larsson.

(обратно)

4

Fifty Shades of Grey, E. L. James.

(обратно)

5

The Help, Kathryn Stockett.

(обратно)

6

Gone Girl, Gillian Flynn.

(обратно)

7

The Da Vinci Code, Dan Brown.

(обратно)

8

Inferno, Dan Brown.

(обратно)

9

The Lincoln Lawyer, Michael Connelly.

(обратно)

10

The Friday Night Knitting Club, Kate Jacobs.

(обратно)

11

Luckiest Girl Alive, Jessica Knoll.

(обратно)

12

В русском издании фамилия автора передана как «Кнолл». (примеч. перев.)

(обратно)

13

The Martian, Andy Weir.

(обратно)

14

The First Phone Call from Heaven, Mitch Albom.

(обратно)

15

The Art of Fielding, Chad Harbach.

(обратно)

16

Bared to You, Sylvia Day.

(обратно)

17

Harry Potter, J. K. Rowling.

(обратно)

18

Журнал книжной индустрии Publishers Weekly публикует список книг года – чемпионов по уровню продаж. (Примеч. авторов.)

(обратно)

19

The Spy Who Came in from the Cold, John le Carr?.

(обратно)

20

Lord of the Flies, William Golding.

(обратно)

21

On the Road, Jack Kerouac.

(обратно)

22

Animal Farm, George Orwell.

(обратно)

23

A Time to Kill, John Grisham.

(обратно)

24

Списки бестселлеров в разных странах немного различаются, но мы будем говорить исключительно о списке NYT, поскольку он неизменно играет роль культурного стандарта и наиболее важен для книжной отрасли. В интернете легко найти критику методов, по которым составляются подобные списки, поскольку ни один из них не покрывает абсолютно все продажи из всех источников. Список NYT учитывает примерно 75 % всех продаж и строится на данных Nielsen BookScan. (Примеч. авторов.)

(обратно)

25

The Shack, William P. Young.

(обратно)

26

House of Leaves, Mark Z. Danielewski.

(обратно)

27

Jimmy Corrigan: The Smartest Kid on Earth, Chris Ware.

(обратно)

28

Определенный артикль в английском языке.

(обратно)

29

Предлог, в русском языке ему могут соответствовать разные предлоги, такие как «из», «от» и др. (Примеч. перев.)

(обратно)

30

Общее описание нашего метода содержится в послесловии. (Примеч. авторов.)

(обратно)

31

Неопределенный артикль в английском языке.

(обратно)

32

Предлог, в русском языке ему могут соответствовать разные предлоги, такие как «в», «через» и др. (Примеч. перев.)

(обратно)

33

Она (англ.).

(обратно)

34

Jane Eyre, Charlotte Brontё.

(обратно)

35

The Devil Wears Prada, Lauren Weisberger.

(обратно)

36

The Bonfire of the Vanities, Tom Wolfe.

(обратно)

37

The Quickie, James Patterson.

(обратно)

38

Extremely Loud & Incredibly Close, Jonathan Safran Foer.

(обратно)

39

Первую попытку выявления бестселлеров мы предприняли в первом нашем эксперименте, в Стэнфорде, еще в 2008 г. Наш корпус текстов состоял из 20 000 романов, но параметров для анализа у нас было гораздо меньше, всего 505. Такой большой корпус текстов был полезен для определенных видов анализа, но при этом он был составлен с уклоном в пользу более ранних периодов – в нем содержалось слишком много книг XIX века, а среди более современной литературы преобладали научная фантастика, фэнтези и любовные романы. Несмотря на эти недостатки, мы получили хорошие результаты: точность определения бестселлера колебалась в пределах 70–80 %.

При написании этой книги мы построили совершенно новый корпус текстов: более разнообразный и более современный. В нем содержалось почти 5000 произведений, в том числе электронные книги, не ставшие бестселлерами, романы, опубликованные традиционным путем, а также бестселлеры из списка NYT числом чуть больше 500. (Примеч. авторов.)

(обратно)

40

Pride and Prejudice and Zombies, Seth Grahame-Smith.

(обратно)

41

Не знаю что (фр.).

(обратно)

42

Джонсон Адам (р. 1967) – американский писатель, лауреат Пулитцеровской премии.

(обратно)

43

Многие методы, упомянутые в данной книге, описаны в учебнике авторства Мэтта «Text Analysis with R for Students of Literature». Этот учебник представляет собой вводное пособие в анализ текста и извлечение данных и предназначен для читателей, не имеющих подготовки в области компьютерных наук. Другая книга Мэтта, «Macroanalysis: Digital Methods and Literary History», содержит подробное описание методов, использованных нами в данной работе, в том числе моделирования темы (обсуждается во 2-й главе) и стилеметрии (в 4-й главе). Для тех, кому нужно еще более подробное описание методов, лежащих в основе наших исследований, мы рекомендуем труд Christopher Manning, Prabhakar Raghavan и Hinrich Schutze «Introduction to Information Retrieval» издательства Cambridge University Press, а также Gareth James, Daniela Witten, Trevor Hastie и Robert Tibshirani «An Introduction to Statistical Learning» издательства Springer. Обе эти книги требуют некоторого знакомства с предметом, но вместе они дают полный и очень хорошо написанный обзор дисциплин анализа текста и машинного обучения. (Примеч. авторов.)

(обратно)

44

The Goldfinch, Donna Tartt.

(обратно)

45

Сокращение расшифровывается как «Стандарты и обмен информацией в книжном деле».

(обратно)

46

On Writing: A Memoir of the Craft, Stephen King.

(обратно)

47

To Kill a Mockingbird, Harper Lee.

(обратно)

48

В отдельных случаях примеры адаптированы для русского читателя. (Примеч. ред.)

(обратно)

49

Мы использовали латентное размещение Дирихле – алгоритм моделирования тем, предложенный Дэвидом Блеем, сотрудником Колумбийского университета. Слово «латентный» в названии метода Блея отражает то, что некоторые темы могут присутствовать в тексте в неявном виде. (Примеч. авторов.)

(обратно)

50

В 8-й главе своей книги «Macroanalysis: Digital Methods and Literary History» (UIUC Press, 2013) Мэтт более подробно описывает алгоритм моделирования тем. В 13-й главе своей книги «Text Analysis with R for Students of Literature» (Springer, 2014) Мэтт объясняет читателям, как проводить моделирование тем на алгоритмическом языке R (и как создавать словесные облака, которые вы увидите на этих страницах). Мэтт также опубликовал несколько объяснений для неспециалистов у себя в блоге (www.matthewjockers.org), в том числе: «The LDA Buffet is Now Open; or, Latent Dirichlet Allocation for English Majors» (29.09.2011) и «“Secret” Recipe for Topic Modeling Themes» (12.04.2013). (Примеч. авторов.)

(обратно)

51

A Clockwork Orange, Anthony Burgess. Использован перевод «Заводного апельсина», сделанный Е. Г. Синельщиковым.

(обратно)

52

A River Runs through It, Norman Maclean.

(обратно)

53

Rogue Lawyer, John Grisham.

(обратно)

54

All the Light We Cannot See, Anthony Doerr.

(обратно)

55

The Girl on the Train, Paula Hawkins.

(обратно)

56

Go Set a Watchman, Harper Lee.

(обратно)

57

The Nightingale, Kristin Hannah.

(обратно)

58

O Alquimista, Paulo Coelho.

(обратно)

59

Ready Player One, Ernest Cline.

(обратно)

60

Роман Селесты Инг. Everything I Never Told You, Celeste Ng.

(обратно)

61

Роман Кристины Бейкер Кляйн. Orphan Train, Christina Baker Kline.

(обратно)

62

Роман Колма Тойбина. Brooklyn, Colm T?ib?n.

(обратно)

63

House Rules, Jodi Picoult.

(обратно)

64

Точность измеряется с помощью перекрестной проверки. В этом случае мы использовали два типа перекрестной проверки: в первом (скажем для читателей, которых интересуют подробности) сначала использовалось многократное обучение на случайной выборке 90 % книг, а затем проверка результатов на оставшихся 10 %. Во втором мы использовали принцип «все, кроме одной», заключавшийся в том, что мы обучали модель на множестве всех книг, изымая оттуда лишь по одной книге единомоментно. В обоих экспериментах успехом считалось, когда машина правильно угадывала класс (бестселлер или небестселлер) изъятой книги (или книг, при первом подходе). Это длительный и кропотливый процесс, включающий в себя обучение и испытание множества моделей. При обучении этих моделей нам приходилось использовать уже изданные книги, про которые было известно, стали они бестселлерами или нет. Первая модель была построена в 2011 г. Добавив в корпус текстов все бестселлеры и некоторое количество небестселлеров, вышедшие за следующие пять лет, мы смогли снова испытать модель и в каком-то смысле проверить, работают ли наши наблюдения, сделанные в 2011-м, для 2015 г. Оказалось, что да. Подкрепив свою уверенность с помощью перекрестной проверки, мы можем исследовать прогноз и связанные с ним показатели вероятностей для каждой книги. По поводу некоторых книг модель не смогла прийти к окончательному выводу, и такие книги получали индекс 51 %. Поскольку случайная догадка имеет вероятность 50 на 50, это не очень высокая степень уверенности. В таком случае мы исследовали все остальные характеристики текста – например стиль или сюжет, – прежде чем сделать вывод о вероятности успеха. Но для других книг модель прогнозировала индекс успеха с большой уверенностью и присваивала им соответствующий рейтинг. (Примеч. авторов.)

(обратно)

65

The House on Hope Street, Danielle Steel.

(обратно)

66

Mixed Blessings, Danielle Steel.

(обратно)

67

Accident, Danielle Steel.

(обратно)

68

The Litigators, John Grisham.

(обратно)

69

The Associate, John Grisham.

(обратно)

70

Calico Joe, John Grisham.

(обратно)

71

Going Home, Danielle Steel.

(обратно)

72

The Firm, John Grisham.

(обратно)

73

Для тех, кого интересуют подробности, в послесловии объясняется, как мы вводили поправки при работе модели с несколькими книгами одного и того же автора. (Примеч. авторов.)

(обратно)

74

The Kiss, Danielle Steel.

(обратно)

75

The Pelican Brief, John Grisham.

(обратно)

76

Разумеется, многие читатели вспомнят хотя бы один бестселлер со званым ужином и танцами. Но единичные случаи не делают статистики. Чтобы тему можно было использовать для прогноза, она должна много раз фигурировать в бестселлерах, попавших в список. (Примеч. авторов.)

(обратно)

77

Англ. Anastasia; эта героиня также известна как Ана и Анастейша. (Примеч. ред.)

(обратно)

78

Этот и другие подобные отзывы на «Пятьдесят оттенков серого» собраны в книге «Пятьдесят писателей о “Пятидесяти оттенках серого”» (Fifty Writers on Fifty Shades of Grey). (Примеч. авторов.)

(обратно)

79

The Lamplighter, Maria S. Cummins.

(обратно)

80

Ulysses, James Joyce.

(обратно)

81

Читателям, интересующимся этой книгой, рекомендуем труды Дженис Рэдуэй (Janice Radway) и Риты Фелски (Rita Felski), особенно «Практическое применение литературы» (Uses of Literature) последней. (Примеч. авторов.)

(обратно)

82

Цитата из книги Дженис Рэдуэй «A Feeling for Books: The Book-of-the Month Club, Literary Taste, and Middle-Class Desire». (Примеч. авторов.)

(обратно)

83

Addicted to You, Krista Ritchie.

(обратно)

84

Playing games, Liliana Rhodes.

(обратно)

85

The Client, John Grisham.

(обратно)

86

The Memory Keeper’s Daughter, Kim Edwards.

(обратно)

87

I, Alex Cross, James Patterson.

(обратно)

88

Morrigan’s Cross, Nora Roberts.

(обратно)

89

The Invention of Wings, Sue Monk Kidd.

(обратно)

90

The Secret Life of Bees, Sue Monk Kidd.

(обратно)

91

Rainbow Six, Tom Clancy.

(обратно)

92

В 2014 г. работы Мэттью по исследованию сюжета привлекли внимание прессы. С тех пор он полностью переписал и доказал свои алгоритмы. В данной книге представлена абсолютно новая работа, основанная на другом корпусе текстов. (Примеч. авторов.)

(обратно)

93

Букер называет такие сюжеты Rags-to-Riches, то есть «из грязи в князи». (Примеч. ред.)

(обратно)

94

Testimony, Anita Shreve.

(обратно)

95

The Kitchen God’s Wife, Amy Tan.

(обратно)

96

Misery, Stephen King.

(обратно)

97

The Aquitaine Progression, Robert Ludlum.

(обратно)

98

Big Little Lies, Liane Moriarty.

(обратно)

99

Wolf Hall, Hilary Mantel. Ранее в русском переводе выходил под названием «Волчий зал».

(обратно)

100

The Paris Wife, Paula McLain.

(обратно)

101

The Stand, Stephen King.

(обратно)

102

Leaving Time, Jodi Picoult.

(обратно)

103

The Forgotten Garden, Kate Morton.

(обратно)

104

The Notebook, Nicholas Sparks.

(обратно)

105

The Last Song, Nicholas Sparks.

(обратно)

106

The Road, Cormac McCarthy.

(обратно)

107

Suite Fran?aise, Ir?ne N?mirovsky.

(обратно)

108

Alice in Wonderland, Lewis Carroll.

(обратно)

109

Gulliver’s Travels, Jonathan Swift.

(обратно)

110

The Corrections, Jonathan Franzen.

(обратно)

111

The Satanic Verses, Salman Rushdie.

(обратно)

112

Firefly Lane, Kristin Hannah.

(обратно)

113

Видеозапись лекции Воннегута о видах сюжетов стоит посмотреть. Она совсем короткая и доступна на YouTube: https://www.youtube.com/watch?v=oP3c1h8v2ZQ. (Примеч. авторов.)

(обратно)

114

Little Bee, Chris Cleave.

(обратно)

115

The Boston Girl, Anita Diamant.

(обратно)

116

The Runaway Jury, John Grisham.

(обратно)

117

The Silver Linings Playbook, Matthew Quick.

(обратно)

118

From Dead to Worse, Charlaine Harris.

(обратно)

119

Англ. sentiment analysis.

(обратно)

120

Фрагмент цитируется по переводу Н. Рейн.

(обратно)

121

Перевод Т. Самсоновой.

(обратно)

122

Их работу «Сравнительное исследование методов машинного обучения для установления авторства» (A Comparative Study of Machine Learning Methods for Authorship Attribution) можно найти в журнале Literary and Linguistic Computing, 25.2, 2010, 215–224. (Примеч. авторов.)

(обратно)

123

Thinner, Stephen King.

(обратно)

124

См. статью Джеймса Смита (James Smythe) в The Guardian от 16 апреля 2013 г. (Примеч. авторов.)

(обратно)

125

Один из наиболее известных случаев установления авторства касается так называемых «Записок федералиста» – анонимно опубликованного сборника статей, написанных Александром Гамильтоном, Джеймсом Мэдисоном и Джоном Джеем. Еще в 1997 г. Ричард С. Форсайт заметил, что задача установления авторства «Федералиста» – «вероятно, лучший кандидат на общепризнанно эталонное стилеметрическое исследование». Мэтт и его соавтор Даниэла Уиттен анализируют «Записки федералиста» в уже упоминавшейся работе «A Comparative Study of Machine Learning Methods for Authorship Attribution». Книга Мэтта «Text Analysis with R for Students of Literature» содержит несколько глав, посвященных установлению авторства и стилеметрическому анализу. В главе «Стиль» книги «Macroanalysis: Digital Methods and Literary History» также рассматриваются многие из этих методов. (Примеч. авторов.)

(обратно)

126

Mrs Dalloway, Virginia Woolf.

(обратно)

127

Цитируется по переводу Е. Суриц.

(обратно)

128

Pride and Prejudice, Jane Austen.

(обратно)

129

Poor Little Bitch Girl, Jackie Collins.

(обратно)

130

The Shining, Stephen King.

(обратно)

131

The Information, Martin Amis.

(обратно)

132

The Chamber, John Grisham.

(обратно)

133

The Rainmaker, John Grisham.

(обратно)

134

Цитируется по переводу М. Тугушевой и А. Санина.

(обратно)

135

Цитируется по переводу И. Стребловой.

(обратно)

136

Процитированные первые строки взяты из следующих романов: «Однажды на берегу океана», Крис Клив; «Утраченный символ», Дэн Браун (The Lost Symbol, Dan Brown); «Хижина», Уильям Пол Янг; «Средний пол», Джеффри Евгенидис (Middlesex, Jeffrey Eugenides); «Рай», Тони Моррисон (Paradise, Toni Morrison); «Девушка, которая играла с огнем», Стиг Ларссон; «Искусство поля», Чед Харбах; «Отраженная в тебе», Сильвия Дэй. (Примеч. авторов.)

(обратно)

137

И (англ.).

(обратно)

138

Но (англ.).

(обратно)

139

Его, ее (англ.).

(обратно)

140

Ты, вы (англ.).

(обратно)

141

The Orphan Master’s Son, Adam Johnson.

(обратно)

142

Прошедшее время от глагола «делать» (англ.), также служебный глагол прошедшего времени.

(обратно)

143

Хотеть (англ.).

(обратно)

144

Мужчина (англ.).

(обратно)

145

Женщина (англ.).

(обратно)

146

Питер упомянул распространенный садовый инструмент для копания, предназначенный для удаления нежелательного (англ.).

(обратно)

147

Питер назвал лопату чертовски полезной штукой (англ.).

(обратно)

148

Фильтруя данные таким образом, мы исключили появление случайных параметров, сбивающих систему с толку. Допустим, в каждом бестселлере использовался бы глагол banjax (редкий глагол, означающий «разрушить, разбить на куски». – Примеч. перев.), а в небестселлерах он не использовался бы вообще. Наша модель быстро решила бы, что наличие этого слова – маркер будущего успеха. И пророчила бы успех любой книге с этим словом, не принимая во внимание никакие другие параметры. Мы избежали этой ситуации, рассматривая только очень распространенные слова, которые гарантированно встречаются как в бестселлерах, так и в небестселлерах. Мы заставили систему исследовать частоту, с которой интересующие нас слова встречаются в книгах обоих типов, и намеренно игнорировать те, которые встречаются только в одном из них. (Примеч. авторов.)

(обратно)

149

Делать; также служебный глагол.

(обратно)

150

Очень (англ.).

(обратно)

151

The Elements of Style, William Strunk, E. B. White.

(обратно)

152

Сокращение от not, отрицательной частицы при глаголе.

(обратно)

153

Сокращение от ряда служебных глаголов сослагательного наклонения, в прошедшем времени (should, would, had, did).

(обратно)

154

Сокращение от служебных глаголов are и were (глагол «быть» во множественном числе, в настоящем и прошедшем времени соответственно).

(обратно)

155

Сокращение от служебного глагола «быть» в настоящем времени, первом лице, единственном числе.

(обратно)

156

О’кей, хорошо, отлично (англ.).

(обратно)

157

Фу, буэ (англ.).

(обратно)

158

Вещь, штука, тварь (англ.).

(обратно)

159

Работу Мэтта на эту тему мы уже упоминали в 1-й главе, но ключевое исследование в данной области провели в 2002 г. Шломо Аргамон, Моше Коппель и Анат Рахель Шимони. Результаты изложены в статье «Автоматическое установление пола автора на основе письменного текста» (Shlomo Argamon, Moshe Koppel, Anat Rachel Shimoni, «Automatically Categorizing Written Text by Author Gender», журнал Literary and Linguistic Computing). (Примеч. авторов.)

(обратно)

160

Помнить, сам(а), только (англ.).

(обратно)

161

Роман Томаса Харриса. Hannibal, Thomas Harris.

(обратно)

162

Роман Эммы Донохью. Room, Emma Donoghue.

(обратно)

163

Роман Шарлин Харрис. Dead and Gone, Charlaine Harris.

(обратно)

164

Suzanne’s Diary for Nicholas, James Patterson.

(обратно)

165

Four Blind Mice, James Patterson.

(обратно)

166

Dolores Claiborne, Stephen King.

(обратно)

167

Written in My Own Heart’s Blood, Diana Gabaldon.

(обратно)

168

Tinkers, Paul Harding.

(обратно)

169

Cold Mountain, Charles Frazier.

(обратно)

170

The Appeal, John Grisham.

(обратно)

171

«Gone girl», роман Гиллиан Флинн, в русском переводе выходил под названием «Исчезнувшая».

(обратно)

172

«Luckiest Girl Alive», роман Джессики Нолл, в русском переводе выходил под названием «Счастливые девочки не умирают».

(обратно)

173

Роман Джона Гришэма. A Painted House, John Grisham.

(обратно)

174

Роман Стивена Кинга и Питера Страуба. Black House, Stephen King, Peter Straub.

(обратно)

175

Роман Денниса Лихейна. Shutter Island, Dennis Lehane.

(обратно)

176

роман Кортни Салливан.

(обратно)

177

роман Даниэлы Стил. В русском переводе выходил под названием «Жить дальше».

(обратно)

178

Роман Ф. Д. Джеймс. Death Comes to Pemberley, P. D. James.

(обратно)

179

Роман Кена Фоллетта. Fall of Giants, Ken Follett.

(обратно)

180

Роман Дэвида Николса. One Day, David Nicholls.

(обратно)

181

роман Кэтрин Харрисон. The Kiss, Kathryn Harrison.

(обратно)

182

роман Дженнифер Иган. A Visit from the Goon Squad, Jennifer Egan. В русском переводе выходил под названием «Время смеется последним».

(обратно)

183

Роман Филиппы Грегори. The Boleyn Inheritance, Philippa Gregory.

(обратно)

184

Роман Сары Груэн. Water for Elephants, Sara Gruen.

(обратно)

185

Роман Дианы Гэблдон. Dragonfly in Amber, Diana Gabaldon.

(обратно)

186

Роман Сидни Шелдон. Memories of Midnight, Sidney Sheldon. В русском переводе выходил под названием «Полночные воспоминания».

(обратно)

187

Названия романов «Щегол», «Заказ», «Утраченный символ», в которых определенный артикль заменен на неопределенный. Получается нечто вроде «Какой-то щегол», «Какой-то заказ», «Какой-то утраченный символ». (Примеч. перев.)

(обратно)

188

«Дар», Даниэла Стил (The Gift, Danielle Steel); «Рождественский свитер», Гленн Бек; «Дневник памяти», Николас Спаркс.

(обратно)

189

«Катушка синих ниток», Энн Тайлер (A Spool of Blue Thread, Anne Tyler); «Тысяча сверкающих солнц», Халед Хоссейни (A Thousand Splendid Suns, Khaled Hosseini); «Жизнь и цель собаки», Брюс Кэмерон; «Игра престолов», Дж. Р. Р. Мартин.

(обратно)

190

«Великолепные руины», Джесс Уолтер (Beautiful Ruins, Jess Walter); «Мешок с костями», Стивен Кинг (Bag of Bones, Stephen King); «Пляжная музыка», Пэт Конрой (Beach Music, Pat Conroy); «Свобода», Джонатан Франзен (Freedom, Jonathan Franzen); «Разоблачение», Майкл Крайтон (Disclosure, Michael Crichton); «Суть дела» (Heart of the Matter; романы с таким названием есть у Грэма Грина и у Эмили Гиффин).

(обратно)

191

Роман Элизабет Страут. Olive Kitteridge, Elizabeth Strout.

(обратно)

192

Роман Джеймса Паттерсона. Cross, James Patterson.

(обратно)

193

Роман Даниэлы Стил. Zoya, Danielle Steel.

(обратно)

194

роман Сэмюэла Ричардсона. Pamela: Or Virtue Rewarded, Samuel Richardson. В русском переводе выходил под названием «Памела, или Награжденная добродетель».

(обратно)

195

Роман Даниеля Дефо. Moll Flanders, Daniel Defoe.

(обратно)

196

Роман Джейн Остин. Emma, Jane Austen.

(обратно)

197

Роман Гюстава Флобера. Madame Bovary, Gustave Flaubert.

(обратно)

198

Роман Генри Филдинга. The History of Tom Jones, a Foundling, Henry Fielding.

(обратно)

199

роман Уильяма Ландея. Defending Jacob, William Landay.

(обратно)

200

роман Нэнси Хорэн. Loving Frank, Nancy Horan.

(обратно)

201

Роман Стивена Кинга. Gerald’s Game, Stephen King.

(обратно)

202

роман Джеймса Паттерсона. Kill Alex Cross, James Patterson.

(обратно)

203

роман Лайзы Дженова. Still Alice, Lisa Genova. Экранизация в российском прокате шла под названием «Все еще Элис».

(обратно)

204

Роман Кена Фоллетта. The Key to Rebecca, Ken Follett.

(обратно)

205

Роман Роберта Харриса. The Ghost, Robert Harris.

(обратно)

206

Роман Эльфриды Елинек. The Piano Teacher, Elfriede Jelinek.

(обратно)

207

роман Сары Блейк. The Postmistress, Sarah Blake.

(обратно)

208

Какая-то, неизвестная почтальонка (англ.).

(обратно)

209

Определенная, известная автору и читателям почтальонка (англ.).

(обратно)

210

Роман А.С.А. Харрисон. The Silent Wife, A.S.A. Harrison.

(обратно)

211

Роман Роберта Гулрика. A Reliable Wife, Robert Goolrick.

(обратно)

212

Роман Грейс Ливингстон Хилл. A Girl to Come Home To, Grace Livingston Hill.

(обратно)

213

Роман Ричарда Адамса. The Girl in a Swing, Richard Adams. На русском языке известен под названием «Девочка на качелях».

(обратно)

214

По аналогии с кинематографическим жанром «фильм нуар» – криминальными драмами, обычно с коварными героинями, которые играют активную роль в сюжете. (Примеч. перев.)

(обратно)

215

Агентивность, также агентность, субъектность (англ. agency) – в социологии способность человека выступать в качестве самостоятельного агента/субъекта и делать осознанный и свободный выбор. (Примеч. перев.)

(обратно)

216

The Bourne Ultimatum, Robert Ludlum.

(обратно)

217

Star Trek, James Blish et al.

(обратно)

218

Научить компьютер разбираться во всевозможных вариациях имен героев, вероятно, невозможно. Мы говорим «вероятно», потому что над проблемой работают очень талантливые ученые. Эта отрасль исследований называется «распознавание именованных сущностей» (Named Entity Recognition, NER). Как и многие другие методы, использованные нами при работе над этой книгой, NER является частью дисциплины «обработка естественного языка». Тем, кого интересует эта область науки, рекомендуем ознакомиться с работой Баммана, Андервуда и Смита «Моделирование литературных персонажей с помощью байесовской модели со смешанными эффектами» (Bamman, Underwood and Smith. A Bayesian Mixed Effects Model of Literary Character), которую можно найти в материалах 52-го годового собрания ассоциации компьютерной лингвистики за 2014 г. (Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics, 2014. P. 370–379).

(обратно)

219

Сейчас у нас есть алгоритмы, прекрасно умеющие находить в тексте имена персонажей, но понять, кто есть кто и кто что делает, – по-прежнему очень трудная задача. Несмотря на эти трудности, в лаборатории Мэтта в Университете Небраски сейчас идут новые исследования, показавшие, что некоторые аспекты агентивности персонажа легко извлечь из текста. За последние два года Мэтт и его студенты из литературной лаборатории Небраски разрабатывали и прототипировали метод распознавания и извлечения данных об агентивности персонажа. Эти данные будут использованы для изучения разработки мужских и женских персонажей в художественной литературе XIX века. Доклад об этой работе, озаглавленный «Исследование пола персонажей и их способности к самостоятельным действиям в романах XIX века» (Understanding Gender and Character Agency in the 19th Century Novel), сейчас находится на рассмотрении рецензентов. Хотя цель этого исследования отлична от нашей, мы нашли, что метод, примененный в Небраске, можно использовать для изучения бестселлеров. С его помощью мы обработали нашу коллекцию бестселлеров, чтобы выявить все местоимения и все имена персонажей, а также связанные с ними глаголы. Затем мы провели ряд экспериментов для классификации, чтобы установить силу связей глаголов с местоимениями, а также связь между определенными парами «местоимение – глагол» и тем, является ли книга бестселлером. (Примеч. авторов.)

(обратно)

220

Нуждаться, испытывать потребность (англ.).

(обратно)

221

Хотеть (англ.).

(обратно)

222

Нуждаться, хотеть, скучать (по кому-то), любить (англ.).

(обратно)

223

Англ. wish.

(обратно)

224

Роман Элис Сиболд. The Lovely Bones, Alice Sebold.

(обратно)

225

Для людей с поведенческим типом А характерны следующие особенности: высокий темп жизни для достижения нечетко сформулированной (часто труднодостижимой) цели; постоянное сравнение себя с другими, стремление конкурировать, настойчивый поиск признания; высокая готовность к действиям; нетерпеливость и постоянная спешка; отсутствие ощущения безопасности; неспособность расслабиться и наслаждаться жизнью.

(обратно)

226

У. Шекспир, «Гамлет», пер. М. Лозинского.

(обратно)

227

Перевод А. Савицкой.

(обратно)

228

См. рассказ Джеймса Джойса «Мертвые» из цикла «Дублинцы» (The Dead, James Joyce). (Примеч. авторов.)

(обратно)

229

Перевод В. Антонова.

(обратно)

230

Роман Лорен Грофф. Fates and Furies, Lauren Groff.

(обратно)

231

Роман Гарта Риска Холлберга. City on Fire, Garth Risk Hallberg.

(обратно)

232

Роман Хунота Диаса. The Brief Wondrous Life of Oscar Wao, Junot D?az.

(обратно)

233

Роман Янна Мартела. Life of Pi, Yann Martel.

(обратно)

234

Роман Маргарет Этвуд. The Handmaid’s Tale, Margaret Atwood.

(обратно)

235

Роман Дэвида Лоуренса. Lady Chatterley’s Lover, D.H. Lawrence.

(обратно)

236

Роман Джона Грина. The Fault in Our Stars, John Green.

(обратно)

237

Сокращение от will – вспомогательного глагола будущего времени.

(обратно)

238

A Heartbreaking Work of Staggering Genius, Dave Eggers.

(обратно)

239

В буквальном переводе «Круг».

(обратно)

240

«Бог ты мой, – подумала Мэй, – я в раю». Здесь и далее «Сфера» цитируется по переводу А. Грызуновой.

(обратно)

241

Finnegans Wake, James Joyce.

(обратно)

242

СЛАДЕНЬКАЯ УТОЧКА!

МОЯ ДРАГОЦЕННАЯ ЛЮБОВЬ СОБЛАЗНИТЕЛЬНО ВЗДЫХАЕТ ПО ТВОЕЙ ЖАЖДЕ. МОЕ ОЧАРОВАНИЕ ЖГУЧЕ СОБЛАЗНЯЕТ ТВОЮ ДРАГОЦЕННУЮ СТРАСТЬ. ТЫ МОЕ ДРАГОЦЕННОЕ БРАТСКОЕ ЧУВСТВО, МОЙ ОШЕЛОМЛЯЮЩИЙ ПЫЛ, МОЙ ЖГУЧИЙ ПЫЛ.

НЕТЕРПЕЛИВО ТВОЙ К. М.У.

(обратно)

243

Do Androids Dream of Electric Sheep? Philip K. Dick.

(обратно)

244

Отрицательная форма третьего лица настоящего времени глагола do («делать», англ.).

(обратно)

245

Сокращенная отрицательная форма настоящего времени глагола can («мочь», англ.).

(обратно)

246

Меня удивила новость, что д-р Арчер пишет роман (англ.).

(обратно)

247

После долгого дня, потраченного на обучение компьютера чтению бестселлеров, Мэтт позвонил Джоди и сказал: «Меня просто убивают эти диалоги». Джоди предложила ему утешение в форме шотландского виски (англ.).

(обратно)

248

Надежда, надеяться, также женское имя Хоуп, означающее «надежда» (англ.).

(обратно)

249

Он не терял надежды, что она купит книгу сама (англ.).

(обратно)

250

Она надеялась, что он купит ей книгу (англ.).

(обратно)

251

Хоуп сказала, чтобы он купил книгу сам (англ.).

(обратно)

252

Для тех, кто интересуется разбором по частям речи, группа обработки естественного языка Стэнфордского университета предлагает демонстрационную программу, доступную в интернете: http://nlp.stanford.edu:8080/parser/index.jsp. (Примеч. авторов.)

(обратно)

253

Использовать для этого программу разбора зависимостей первоначально предложили два студента Мэтта – Габи Кириллофф и Джонатан Чен. (Примеч. авторов.)

(обратно)

254

«Мэй понимала, что Рената за ней наблюдает, и знала, что сама таращится в некоем ужасе» (англ.).

(обратно)

255

Разбор предложения проведен с помощью демонстрационной онлайн-версии программы разбора зависимостей, разработанной в Стэнфордском университете и доступной в интернете по адресу: http://nlp.stanford.edu:8080/parser/index.jsp. (Примеч. авторов.)

(обратно)

256

Мэй (англ.).

(обратно)

257

Знала (англ.).

(обратно)

258

Наблюдает (англ.).

(обратно)

259

Конечно, реальная жизнь сложнее, и, будь у нас подлинные данные по продажам книг, мы могли бы использовать их вместо бинарного разграничения (книга либо попала, либо не попала в список бестселлеров NYT). При наличии таких данных мы также могли бы использовать совершенно иной набор прогностических алгоритмов. Следует заметить, что в самых первых экспериментах мы использовали три класса книг – романы, попавшие на первое место в списке бестселлеров, романы, которые попали в список, но не заняли первого места, и небестселлеры. Удивительно, что наша модель смогла с уверенностью в 80 % определить разницу между бестселлером номер один и бестселлерами, занявшими 2–15-е места в списках. То же было верно в отношении «двузначных» книг, то есть тех, которые остаются в списке бестселлеров месяцами. Подобные нюансы мы сочли слишком мелкими для включения в данную книгу, но наблюдать их было чрезвычайно интересно. (Примеч. авторов.)

(обратно)

260

Действительно, по-настоящему (англ.).

(обратно)

261

Чтобы границу было легче увидеть, мы изменили расположение книг на плоскости, убрав те, что оказались ближе всего к границе. (Примеч. авторов.)

(обратно)

262

В использованных нами алгоритмах обучения задействована довольно сложная математика. Прекрасный обзор методов KNN и SVM содержится в работе An Introduction to Statistical Learning by James, Witten, Hastie и Tibshirani. Springer: New York, 2013. Очень краткое описание метода Nearest Shrunken Centroids можно найти по адресу http://statweb.stanford.edu/~tibs/PAM/Rdist/howwork.html, вместе со ссылкой на научную работу «Diagnosis of multiple cancer types by shrunken centroids of gene expression», в которой описано первое испытание этого алгоритма. Заинтересованные читатели могут также ознакомиться со статьей: Jockers Matthew L. and Daniela M. Witten. A Comparative Study of Machine Learning Methods for Authorship Attribution // Literary and Linguistic Computing, 25.2, 2010, 215–224. (Примеч. авторов.)

(обратно)

263

Мы экспериментировали с различными значениями К. лучшие результаты получались при К = 15. (Примеч. авторов.)

(обратно)

264

Мы также изучали получившиеся матрицы ошибок, чтобы лучше понять факторы, влияющие на точность модели, но это уже выходит за рамки послесловия. (Примеч. авторов.)

(обратно)

265

Более подробное, но все же без явного технического уклона описание интеллектуального анализа текста и машинного обучения можно найти в работе: Jockers Matthew L. and Underwood Ted. Text-Mining the Humanities // New Companion to the Digital Humanities / Eds. Susan Schreibman, Ray Siemens, John Unsworth. Wiley-Blackwell, 2016. (Примеч. авторов.)

(обратно)

Оглавление

  • 1. Бестселлерометр, или Почему анализ текста приводит к революции в книгоиздании
  •   Белые лебеди
  •   Из любви к книгам
  •   Откуда мы взялись
  •   Машинное чтение
  •   Договор
  •   1. Номер первый
  •   2. Верьте нам, как мы доверились машине
  •   3. Волшебного чая не существует
  •   4. «Черный ящик»
  • 2. Крестные родители, или Почему важно находить время друг для друга
  •   Зачем мы читаем?
  •   Секс, наркотики и рок-н-ролл
  •   Проверка
  •   Подходящие герои
  •   Списки: тематика
  • 3. Хватай быка за рога, или Как добиться идеальных изгибов
  •   Поиски клада
  •   Код тела
  •   Идеальные изгибы
  •   Одинокие звезды
  •   Списки: сюжет
  • 4. Дебютанты, или Почему важна каждая запятая
  •   Покупка цветов
  •   Новогодние елки
  •   Мужчины и женщины
  •   Списки: стиль
  • 5. Литература нуар, или Чего хотят девушки
  •   Что в имени тебе моем?
  •   Посеешь поступок – пожнешь характер
  •   Сделай же что-нибудь!
  •   Героиня нуар
  •   Вынем кролика из шляпы
  •   Списки: персонажи
  • 6. Избранный, или Когда компьютер смеется
  •   Точка совершенства
  •   Анатомия идеального романа
  •   Жизнь причудливей всякого вымысла
  •   Приз зрительских симпатий
  •   Списки: все точки данных
  • Эпилог Роман, написанный машиной, или Почему авторы на самом деле очень важны
  • Постскриптум, или Некоторые подробности о методе
  •   Интеллектуальный анализ текста
  •   Машинное обучение
  • Выражения благодарности

  • Наш сайт является помещением библиотеки. На основании Федерального закона Российской федерации "Об авторском и смежных правах" (в ред. Федеральных законов от 19.07.1995 N 110-ФЗ, от 20.07.2004 N 72-ФЗ) копирование, сохранение на жестком диске или иной способ сохранения произведений размещенных на данной библиотеке категорически запрешен. Все материалы представлены исключительно в ознакомительных целях.

    Copyright © читать книги бесплатно