Российские исследователи представили уникальный тестовый инструмент, предназначенный для моделирования процесса консультации между врачом и пациентом. Система учитывает жалобы, медицинские снимки и даже особенности характера больного, что позволяет объективно оценивать компетентность медицинских нейросетей в решении сложных диагностических задач.
Внедрение данной разработки способно повысить качество функционирования профильного искусственного интеллекта на величину от 6,5 до 20 процентов, сообщает ТАСС. Представители Сбера уточнили, что компании, занимающиеся созданием телемедицинских платформ, могут абсолютно бесплатно применять этот тест для настройки и улучшения своих алгоритмов в максимально реалистичных условиях.
Над проектом трудилась объединенная команда специалистов из Центра практического ИИ Сбера, НИУ ВШЭ и Института системного программирования РАН. Для имитации живого общения были созданы специальные цифровые агенты, роль которых исполняют большие языковые и мультимодальные модели, берущие на себя функции как лечащего врача, так и пациента.
База данных для тестирования включает почти три тысячи клинических случаев, охватывающих 34 различных диагноза и основанных на реальных медицинских документах и изображениях. Опираясь на этот массив данных, авторы сравнили эффективность популярных стратегий постановки диагноза, которые применяются в современных открытых и закрытых вычислительных системах.
Результаты проверок наглядно продемонстрировали, что наличие у нейросети навыка ведения диалога улучшает точность диагностики на 6,5 процента, а умение классифицировать медицинские показатели дает прирост эффективности до 20 процентов. Ученые надеются, что новый инструмент станет важным этапом для совершенствования языковых моделей в отечественном и мировом здравоохранении.

