Придумать

«КиберЛенинка»: сделать науку популярнее и заработать на этом

Выпускники МГУ и МИФИ Дмитрий Семячкин, Михаил Сергеев и Евгений Кисляк основали научную онлайн-библиотеку, чтобы сделать «что-то полезное для общества». Они сделали сотни тысяч научных материалов доступными большому количеству людей благодаря качественному поиску, а затем придумали, как монетизировать проект за счет дополнительных сервисов для издателей, государства и бизнеса. Сегодня «КиберЛенинка» — крупнейший открытый онлайн-архив Европы с 3 млн пользователей ежемесячно. Библиотека привлекла 30 млн рублей от структур Игоря Рыбакова и в прошлом году на публикации платных научных материалов заработала почти миллион рублей, а через 2-3 года планирует выйти на самоокупаемость (с выручкой сервисов около 50 млн рублей в год). Основатели «КиберЛенинки» рассказали Inc., как сделали научные статьи «видимыми» для поисковиков и как планируют зарабатывать на издателях и читателях научной литературы по всему миру.


Монетизация науки

У основателей «КиберЛенинки» — Дмитрия Семячкина, Михаила Сергеева и Евгения Кисляка — три года ушло на безрезультатные поиски государственных и частных инвестиций. В самоокупаемость социального проекта никто не верил:

— В основном потенциальные инвесторы крутили пальцем у виска и говорили: «Что за тема? Непонятно». Но мы были уверены: хотя сам проект социальный, вокруг него можно строить сервисы, которые поддерживали бы всю экосистему, — объясняет Семячкин.

Тогда они придумали, как монетизировать библиотеку через дополнительные сервисы. Сегодня основатели «КиберЛенинки» разрабатывают сервисы платных услуг, которые позволят продавать услуги ученым и издателям и делать аналитику данных для государства и бизнеса. «КиберЛенинка» привлекла 30 млн рублей инвестиций от структур миллиардера Игоря Рыбакова, а через 2-3 года планируется выйти на самоокупаемость с оборотом около 50 млн рублей в год.

Школьные друзья Семячкин и Сергеев, а также однокурсник Сергеева по МИФИ, программист Евгений Кисляк запустили библиотеку в конце 2011 года как общественный проект. Когда Дмитрий Семячкин писал диссертацию в Институте прикладной математики им. Келдыша, ему не нравилось, что за доступ к научным публикациям онлайн нужно платить.

— Перед этим я вышел из бизнеса компании «Шофт» по автоматизации библиотек (сотрудничали с Ленинской библиотекой, но разошлись с партнером, до этого развивали компанию четыре года, — Inc.), — вспоминает Семячкин. — Мы с Михаилом встретились и поняли, что есть время сделать что-то полезное.

— Мы с Димой и Женей давно работали вместе и решили сделать pet-project для души — выложить в интернет научные статьи, — говорит Михаил Сергеев.

Друзья начали собственными силами делать сайт: Кисляк, профессиональный программист (в то время он делал IT-проекты для института систем управления — ЦНИИСУ), в свободное время написал код. Он же занимался технической стороной вопроса — сайтом, бэкэндом, серверами. Дизайн «недорого» сделал знакомый дизайнер. Но контент — главное для библиотеки — предстояло набрать с нуля.

Фото: Глеб Леонов/Inc.

Наука без пиратства

Основатели действовали легально: обращались к знакомым из научной среды, звонили в редакции и убеждали присылать им тексты. Для публикации в «КиберЛенинке» нужно было согласие изданий заключить договор и разместить свой контент под открытыми лицензиями Creative Commons.

Статьи должны были легко индексироваться поисковиками — иначе библиотека не набрала бы пользователей. Раньше в России почти не было научных онлайн-журналов, у наиболее продвинутых изданий были сайты, но тексты с сайтов почти не находились при поиске, объясняет Евгений Кисляк:

Дмитрий Семячкин. Фото: Глеб Леонов/Inc.

— Журналы не умели распознавать PDF-файлы и вытаскивать из них текст, а библиотекам это было неинтересно. Какой бы гениальной ни была публикация, если ее не ищет поисковик— считай, ее вообще нет.

Журналы присылали в «КиберЛенинку» верстку в формате PDF, иногда весь выпуск единым файлом. Приходилось вручную разделять, создавать для каждой отдельную карточку, выделять метаданные.

— Это была запара. Мы сделали много инструментов, не видных пользователю, но позволяющих готовить данные в полуавтоматическом режиме, — говорит Семячкин.

Основатели «КиберЛенинки» создали топ из самых интересных и доступных даже для неподготовленных читателей статей (сейчас на главной странице библиотеки — материалы вроде «Виды проституции в современном российском обществе», «Кастрация и ее влияние на организм котов», «Современное представление женщин о красивом мужчине»). Для этого их SMM-щик находил самые интересные статьи и ставил их в соцсети.

Статьи легко индексировались, и аудитория «КиберЛенинки» быстро выросла: через семь месяцев было 500 тыс. уникальных пользователей в месяц (сейчас — более 3 млн человек ежемесячно). По словам Семячкина, рекламы не было — просто высокий спрос на научный контент, наконец «видимый» поисковикам. Стало легче привлекать новые журналы:

— Поначалу многие опасались, мол, а что это мы отдадим все открыто и бесплатно? Мы им на пальцах объясняли, что открытая наука — это очень здорово, что читателей будет в 5-10 раз больше, увеличится цитируемость. Когда после семи месяцев мы показали стремительный рост трафика, сомнения отпали, — объясняет Семячкин.


«КиберЛенинка» в цифрах

Источник: данные компании


1,3

млн статей доступны в «КиберЛенинке».


1311

научных журналов заключили договор с онлайн-библиотекой.


3

млн уникальных пользователей в месяц посещают сайт.


22

млн человек зашли на сайт в 2016 году.


11

человек работает в компании.


>1

млн рублей — выручка в 2016 году от размещения научных статей.

Фото: Глеб Леонов/Inc.

Хождение по инвесторам

Евгений Кисляк. Фото: Глеб Леонов/Inc.

Поначалу основатели работали втроем, потом наняли менеджера по работе с партнерами — Юлию Мальсагову (она общалась с издателями и заключала договоры), позже — еще 3-4 сотрудников и разработчиков на аутсорсе (при необходимости).

На поддержание «КиберЛенинки» стало уходить по 10 млн рублей в год — в основном на зарплаты сотрудникам (у основателей зарплаты не было). Все трое вкладывали собственные деньги — по словам Кисляка, накопленные за время работы в других местах. Как объясняет Дмитрий Семячкин, они «просто делали то, что считали важным»:

— Хотелось, чтобы проект не умер, а жил и развивался уже без наших инвестиций. Но будем рады на нем ещё и заработать.

«КиберЛенинку» пытались развивать как социальный проект, но чиновники и государственные библиотеки не впечатлились. Как вспоминает Кисляк, это была «одна сплошная печаль». Денег дали только две некоммерческие организации — «Информационная культура» и «Ассоциация интернет-издателей» — но полученных от них 600 тыс. рублей проекту хватило едва на месяц. Частные инвесторы: Агентство стратегических инициатив, ФРИИ, фонд Михаила Прохорова, фонд Дмитрия Зимина «Династия», фонд Microsoft, ФАНО, РВК, и РосНАНО, — тоже отказали.

— Я думаю, мы были «неформат»: для государственного финансирования не «в системе», а для фондов — не «стартап», — говорит Михаил Сергеев.

Отчаявшись, основатели решили монетизировать сервис самостоятельно. Они стали брать плату с коммерческих изданий — научных журналов, публикующих статьи за деньги (материалы там не рецензируются, и их качество и научная ценность под вопросом). Абонентская плата изданий за хранение на портале — от 4 тыс. до 8 тыс. рублей в год, за размещение каждой статьи (в зависимости от количества статей) цена — от 0 до 100 тыс. рублей в год. Сегодня у библиотеки 25 «платных» изданий, а сумма их платежей за последний год достигла 1 млн рублей, но этого мало, чтобы полностью обеспечить проект, говорит Семячкин.


«КиберЛенинка» и Google

В июле 2016 года «КиберЛенинка» запустила совместный проект с Google Scholar — рейтинг научных изданий на

русском языке. Русскоязычные издания впервые вошли в проект Scholar Metrics — топовые публикации Google Scholar. О подготовке данных для проекта основатели библиотеки договорились напрямую с одним из создателей и руководителем Google Scholar Анурагом Ачарьей.

Вторым источником для проекта стал портал Mathnet с 60 журналами. Рейтинг высчитывает Google, но до «КиберЛенинки» расчеты были невозможны — не было единой базы русскоязычных текстов достаточного объема. Для каждого журнала посчитали две метрики: индекс Хирша (индекс цитируемости ученых) за последние пять лет и среднее количество цитат для статей, вошедших в индекс. По данным портала Webometrics, сегодня «КиберЛенинка» — третий в мире проект по видимости в Google Scholar.

В 2017 году в «КиберЛенинку» инвестировал российский предприниматель Игорь Рыбаков, совладелец компании «Технониколь» и участник списка Forbes. По словам Дмитрия Семячкина, основатели обратились к нему в начале года, узнав, что Рыбаков Фонд интересуется социально значимыми инвестициями. Через вице-президента фонда Алену Светушкову Семячкин познакомился с Игорем Рыбаковым, быстро нашел с ним общий язык, и предприниматель стал не только инвестором, но и ментором проекта. В августе стороны объявили о завершении сделки — структуры Рыбакова приобрели 25% «Киберленинки» за 30 млн рублей (остальное в равных долях распределено между тремя основателями библиотеки).

Фонд инвестировал в «КиберЛенинку» во многом из-за сильной команды основателей, рассказала Inc. вице-президент фонда Алена Светушкова. По ее словам, Игорь Рыбаков в обозримом будущем не собирается выходить из проекта. Фонд рассчитывает, что библиотека будет сочетать «социальную миссию» с коммерческим подходом:

— На наш взгляд, будущее за гибридными моделями организаций, сочетающими коммерческий и некоммерческий подходы. Большую часть рынка в социальном секторе займут организации, предоставляющие часть сервисов за деньги тем, кто может за них платить.

— Рыбаков посоветовал нам не бояться ставить большие, очень больше цели, — говорит Семячкин. — По его совету мы смогли нарисовать картину — с платформой, экосистемой и сервисами.


Знания — деньги


Станислав Козловский

исполнительный директор российского отделения WikiMedia:


— Проблема «КиберЛенинки» в том, что они берут только журналы, которые передают им произведения под свободной лицензией. Но таких научных журналов в России не так уж много, особенно авторитетных (а неавторитетные никому не интересны). В целом у «КиберЛенинки» большой потенциал для развития, особенно в случае перехода на другие языки и подключения других стран — тогда она сможет потеснить стандартные базы научных статей, заточенные на английский язык, например, Scopus или Web of Science.

Рынок научных журналов сегодня захвачен такими издательствами, как Reed Elsevier, Springer Science, Oxford University Press, Wiley-Blackwell, Nature и другими. Но тенденция к open access набирает обороты: статьи в свободном доступе чаще цитируют по сравнению со статьями за paywall (а цитируемость для ученого — важнее любых гонораров). Думаю, чем больше ученых будет узнавать о «КиберЛенинке», тем больше людей начнет ею пользоваться.

На привлеченные средства основатели «КиберЛенинки» планируют расширить команду и запустить Платформу управления знаниями — совокупность коммерческих сервисов для издателей, читателей, ученых, а также для государства, бизнеса, производства и потребления знаний. Доступ к библиотеке для пользователей останется бесплатным, обещает Дмитрий Семячкин, зато Платформа через три года выведет библиотеку на самоокупаемость.

— Мы хотим стать глобальной площадкой по обеспечению науки контентом, — говорит Семячкин.

Первым шагом на пути к монетизации «КиберЛенинки» станет сервис для издателей, который, как предполагается, должен принести более 50% выручки. Он позволит легко создавать научные журналы, упростит издательский процесс и свяжет всех его участников — редакторов, рецензентов и авторов, а также автоматизирует рутинные задачи с помощью технологий AI/ML.

— Это будет как Битрикс для сайта — набор технологических и организационных инструментов, чтобы журнал можно было запустить уже завтра, — объясняет Дмитрий Семячкин.

Наконец, в будущем «КиберЛенинка» планирует разработать рекомендательный сервис для ученых на основе искусственного интеллекта. Однако для этого потребуются отдельные инвестиции и расширение англоязычного контента (только на разработку уйдет около $2 млн, оценивает Семячкин). Похожую систему Meta, которая делает поиск по 26 млн научных публикаций и выдает ученым рекомендации, в январе приобрел фонд Марка Цукерберга Chan Zuckerberg Initiative.

— Сейчас ни один ученый не способен прочитать все статьи по его теме. Скоро ученые просто не смогут заниматься исследованиями без автоматических рекомендаций на основе AI/ML о том, что читать дальше, — объясняет Дмитрий Семячкин.

В следующем году «КиберЛенинка» планирует привлекать новый раунд инвестиций — то, что Семячкин называет стадией pre-A. Они рассчитывают на 200-300 млн рублей, которые позволят расширить команду и подготовить почву для выхода на международный рынок — в англоязычные страны, а также в Китай и Индию. Эти деньги должны покрыть растущие расходы — а через три года это будет примерно 50 млн рублей в год, рассчитывает Семячкин. К тому моменту платные сервисы наберут обороты и проект выйдет на самоокупаемость.

Фото: Глеб Леонов/Inc.

Открытая наука

Сейчас с «КиберЛенинкой» сотрудничают 1300 изданий, в том числе журналы 16 вузов из проекта российского Министерства образования «5-100», куда входит 21 ведущий университет России (не считая МГУ и СПбГУ). Международная аудитория из США и Европы — около 1 млн человек в год. «КиберЛенинка» планирует увеличивать количество англоязычных материалов (сегодня таких всего несколько тысяч) и число иностранных читателей.

— Мы хотим расширяться в англоязычный интернет — единого ресурса с научными статьями там нет, и наш продукт был бы очень востребован, — уверен Евгений Кисляк.

На Западе у «КиберЛенинки» есть конкуренты — например, маркетплейс для исследователей Academia.edu: это более 19 миллионов материалов, социальная сеть и платформа для сотрудничества ученых ResearchGate, которая объединяет более 13 млн человек. Последняя собрала в общей сложности более $100 млн инвестиций, в том числе от основателя Microsoft Билла Гейтса, актера и инвестора Эштона Катчера, банка Goldman Sachs и компании LVMH Moët Hennessy. ResearchGate берет деньги с компаний и университетов за размещение рекламы с их вакансиями, а также планирует запустить маркетплейс для лабораторий, где они могли бы продавать свои услуги и оборудование. Но пока стартап так и не вышел на самоокупаемость. Дмитрий Семячкин собирается извлечь урок из опыта конкурентов:

— ResearchGate не решил инфраструктурные задачи: мало собрать контент, надо ещё дать инструменты для его производства и потребления. У них проблемы с правами на контент и куча исков от издательств — а мы выбрали более сложный, но легальный путь.

После создания инфраструктуры для работы с научными материалами и издательской платформы «КиберЛенинка» собирается платно размещать вакансии для ученых и исследователей. Все эти сервисы пригодятся как в России, так и за рубежом, уверен Дмитрий Семячкин:

— Мы уже сейчас мыслим себя международной компанией и не хотим ограничиваться только Россией. Наука не имеет границ — поэтому мы хотим выходить на англоязычный рынок и предоставлять сервисы для ученых по всему миру.