Компания Inception из города Пало-Альто (США) вышла из режима скрытой разработки (stealth) и представила нейросеть Mercury на совершенно новой архитектуре. Она совмещает преимущества традиционных языковых моделей и алгоритмов для генерации изображений.
Фото: Freepik
Главное преимущество Mercury — способность обрабатывать разные части текста параллельно, а не последовательно, как это делают обычные нейросети. Благодаря этому новая модель генерирует текст в 10 раз быстрее обычных LLM, потребляя при этом на порядок меньше вычислительных ресурсов.
Inception представили пока две модели — Mercury-small для программирования (по качеству ответов не уступает GPT-4o mini) и Mercury-mini, генерирующую до 1 тыс. токенов в секунду.
Стартап уже предлагает доступ к API и возможность запуска нейросетей на серверах клиента. Кроме того, у компании есть набор готовых специализированных моделей для разных бизнес-задач.
Inception был основан летом прошлого года, а в команду помимо основателя компании — профессора Стэнфордского университета Стефано Эрмона вошли его бывшие студенты — профессор Калифорнийского университета в Лос-Анджелесе Адитью Гровер и профессор Корнельского университета Владимир Кулешов. В стартап вложился венчурный фонд Mayfield Fund — сумма раунда не раскрывается. У Inception уже есть клиенты, включая несколько ведущих компаний из списка Fortune 100.
Ранее подразделение Yandex B2B Tech предоставило компаниям возможность самостоятельно дообучать модели с открытым исходным кодом при помощи методики энергоэффективной сети большого радиуса действия LoRA. Это один из самых надежных способов адаптации нейросетей к специализированным задачам.