Исследователи из Microsoft AI разработали новую систему MAI Diagnostic Orchestrator (MAI-DxO), которая имитирует работу целого консилиума врачей-специалистов. Все роли в этом виртуальном консилиуме, такие как Dr. Hypothesis, Dr. Test-Chooser и даже Dr. Challenger, выполняются одной языковой моделью, что обеспечивает структурированный и всесторонний подход к диагностике.
Диагностика сложных и редких заболеваний — это трудный, дорогостоящий и не всегда точный процесс. Врачи полагаются на свой опыт и знания, но даже им бывает сложно поставить правильный диагноз. Существующие ИИ-модели для медицины часто тестируются на упрощенных данных, что не отражает реальной клинической практики и завышает их показатели.
По словам представителей Microsoft, новая ИИ-система MAI-DxO способна решить эту проблему. Для оценки ее работы был создан новый, более реалистичный тест SDBench, основанный на 304 сложных клинических случаях из авторитетного медицинского журнала. В отличие от стандартных тестов, здесь ИИ (или человек) получает только краткое описание случая и должен последовательно запрашивать дополнительную информацию и назначать анализы, как в реальной жизни.
Результаты тестирования оказались поразительными. Система MAI-DxO в паре с моделью G-3 от OpenAI достигла точности диагностики 79,9%. Для сравнения, группа из 21 опытного врача в тех же условиях показала в среднем точность всего 19,9%. Таким образом, ИИ оказался в четыре раза точнее человека.
Более того, ИИ оказался и экономически эффективнее. Средняя стоимость диагностики одного случая с помощью MAI-DxO составила $2 397, в то время как у врачей — $2 963. Самое важное, что система-оркестратор MAI-DxO снизила стоимость использования одной только модели G-3 почти на 70% (с $7 850), при этом даже немного повысив ее точность. Эта технология, хоть и находится на стадии исследования, демонстрирует огромный потенциал для создания мощных инструментов поддержки принятия врачебных решений, способных революционизировать диагностику в медицине.