Борясь за актуальность в растущей и сверхконкурентной сфере искусственного интеллекта, IBM представила пять новых моделей генеративного искусственного интеллекта в своей недавно запущенной платформе обработки данных Watsonx. Об этом сообщил TechCrunch.
Новые модели, называемые моделями серии Granite, представляют собой стандартные модели больших языков (LLM) наподобие OpenAI GPT-4 и ChatGPT. Они способны суммировать, анализировать и генерировать текст. IBM предоставила очень мало подробностей о Granite, что сделало невозможным сравнение моделей с конкурирующими LLM, включая те, что до этого были у IBM. Но компания утверждает, что раскроет данные, используемые для обучения моделей серии Granite, а также шаги, используемые для фильтрации и обработки этих данных, до того как модели станут доступны в третьем квартале 2023 года.
«Эти новые модели серии IBM Granite были разработаны с использованием тщательно отобранных данных корпоративного качества, а не общедоступных данных. Например, у нас есть модель, обученная на финансовых данных, и это позволяет разработчикам ИИ использовать гораздо меньшую модель, которая может быть такой же производительной, как и более крупный ее конкурент. Они также могут поддерживать большинство корпоративных задач — таких как обобщение, генерация контента и извлечение информации», — сказал Тарун Чопра, вице-президент IBM по управлению продуктами для данных и искусственного интеллекта.
В другом месте, в Watsonx.ai — компоненте Watsonx, который позволяет клиентам тестировать, развертывать и отслеживать модели после развертывания, — IBM внедрил Tuning Studio, инструмент, который позволяет пользователям адаптировать генеративные модели ИИ к своим данным.
Используя Tuning Studio, клиенты IBM Watsonx могут точно настраивать модели для новых задач, используя до 1 тыс. примеров. Как только пользователи укажут задачу и предоставят помеченные примеры в требуемом формате данных, они смогут развернуть модель через API из IBM Cloud.
В Watsonx.ai также скоро дебютирует синтетический генератор для табличных данных — коллекций строк и столбцов, найденных в реляционных базах. Согласно заверениям IBM, генерируя синтетические данные из пользовательских схем и внутренних наборов данных, компании могут с помощью генератора извлекать информацию для обучения и точной настройки моделей ИИ со «сниженным риском». При этом непонятно, что именно подразумевается под «сниженным риском», учитывая подводные камни обучения ИИ на синтетических данных.
IBM также запускает новые возможности генеративного искусственного интеллекта в Watsonx.data, хранилище данных компании, которое позволяет пользователям получать доступ к данным, применяя механизмы запросов, управление, автоматизацию и интеграцию с существующими базами данных и инструментами. С четвертого квартала 2023 года в рамках предварительной версии технологий клиенты смогут «обнаруживать, дополнять, визуализировать и уточнять» данные для ИИ с помощью инструмента самообслуживания, похожего на чат-бота.
«Возможности генеративного искусственного интеллекта, которые станут доступны в Watsonx.data позднее в этом месяце, позволят пользователям упростить и ускорить способ взаимодействия со своими данными. Чтобы проиллюстрировать, как может работать этот опыт, предположим, что пользователь ищет конкретные данные. Используя интерфейс помощника чата AI в Watsonx.data, диалоговая модель Watsonx.ai может генерировать текстовый ответ вместе с вызовами API и параметрами для поддержки запроса этого пользователя. Также возможно импортировать внешние данные, используя тот же интерфейс, а модель искусственного интеллекта выполнит семантическое обогащение данных», — сообщил Тарун Чопра.
Примерно в то же время — в четвертом квартале 2023 года — Watsonx.data получит возможность использования векторной базы данных для поддержки генерации с расширенным поиском (RAG), говорят в IBM. RAG — это платформа искусственного интеллекта для повышения качества ответов, генерируемых LLM, путем обоснования модели внешними источниками знаний, что, очевидно, полезно для корпоративных клиентов IBM.
Среди других важных новостей IBM приступает к технической предварительной версии Watsonx.governance, набора инструментов, который, по довольно расплывчатым словам компании, обеспечивает механизмы для защиты конфиденциальности клиентов, обнаружения предвзятости и отклонений модели и помогает организациям соблюдать этические стандарты. А начиная со следующей недели IBM запустит Intelligent Remediation, которая, по словам компании, будет использовать генеративные модели искусственного интеллекта, чтобы помочь ИТ-командам суммировать инциденты и предлагать рабочие процессы для реализации решений.
Напомним, что до этого основанный экс-исследователем IBM стартап Elemental Cognition AI привлек $60 млн через продажу акций 17 инвесторам. Команда уже разработала два корпоративных чат-бота, Cogent и Cora, для финансовых услуг, логистики и автоматизации научных исследований.