В Институте востоковедения РАН придумали, как помочь исследователям и предпринимателям, работающим с коллегами и первоисточниками из Азии, Африки и Ближнего Востока. Вместе с «Яндексом» они запустили ИИ‑помощника, который ускоряет анализ данных в сотни раз: вместо 8–10 источников в день система обрабатывает до 1 тыс. Подробности — в распоряжении «Инка».

Freepik

По данным ЮНЕСКО, большинство научных текстов, написанных не на английском (или даже не на языках ООН), остаются недоступными для глобального сообщества: только небольшая доля исследований переводится на английский или другие международные языки. Это создает дисбаланс в научной коммуникации — знания, накопленные в странах Азии, Ближнего Востока или Африки, редко попадают в международные базы данных и остаются вне мирового академического оборота.

ИИ‑помощник решает эту проблему за счет комплексного анализа текстов. Он не просто переводит, а выделяет ключевые факты, формирует аналитические выжимки и создает русскоязычные дайджесты публикаций — например, из китайских СМИ. Это позволяет исследователям оперативно получать структурированную информацию без необходимости владеть всеми восточными языками на профессиональном уровне.

Эффективность решения подтверждают цифры. По словам Александра Костыркина, старшего научного сотрудника Лаборатории цифровых исследований современного Востока Института востоковедения РАН, время на анализ одной исследовательской задачи сокращается в 6–8 раз: с нескольких часов до 10–15 минут. Такой прирост производительности дает возможность обрабатывать больше материалов, глубже изучать контекст и выявлять скрытые тенденции.

Техническая база помощника впечатляет: его архив уже содержит свыше 1,5 млн документов. Особое внимание уделено китайскому языку — система работает с четырьмя его вариантами: континентальным, тайваньским, гонконгским и сингапурским. Это критически важно, учитывая, что китайский остается одним из самых сложных для машинного анализа из‑за иероглифической письменности и региональных различий.

Разработкой занимались специалисты Yandex Cloud и студенты Школы анализа данных. Они обучили генеративные модели на базе востоковедных знаний Института востоковедения РАН — монографий, научных статей и других материалов. Такой подход обеспечил не только высокую точность перевода, но и понимание культурно‑исторического контекста, что особенно ценно для академических исследований.

В перспективе ИИ‑помощник станет доступен всем исследователям в открытом доступе. Как отмечает Анна Лемякина, директор по национальным и стратегическим проектам Yandex Cloud, цель проекта — сделать труднодоступные данные доступными, а анализ — более глубоким и точным. Это шаг к новой эре востоковедения, где технологии снимают языковые барьеры и открывают двери в мир азиатских знаний.

В целом использовать ИИ для помощи в обучении может быть полезным не только в академической среде. В середине сентября компания Babbel, специализирующаяся на изучении языков, представила новую функцию Babbel Speak. Это голосовой тренажер на базе искусственного интеллекта, предназначенный для того, чтобы помочь начинающим преодолеть языковой барьер и начать уверенно говорить на иностранном языке. Сам помощник общается с учеником как человек, а его цифровая «начинка» анализирует уровень прогресса. Эффективность структурированного языкового обучения уже доказана на примере футбольного клуба «Интер Майами», где игроки из более чем 15 стран используют Babbel для преодоления языковых барьеров.