Введение

Интерпретация рентгенограмм в стоматологии — одна из наиболее ответственных стадий клинического принятия решений. Но этот процесс не всегда работает с полной согласованностью. То, что одну и ту же периапикальную рентгенограмму разные врачи могут интерпретировать по-разному, — задокументированный факт. Особенно для таких находок, как кариес, периапикальные поражения и потеря кости при пародонтите, вариабельность между клиницистами показывает: качество диагностики зависит не только от самого изображения, но и от опыта, уровня внимания и стандарта интерпретации.

В этом контексте ИИ-системы анализа изображений в стоматологии привлекают всё больше внимания. Но реальный вопрос не в том, «существуют ли они», а в том, что реально говорит их нынешний уровень производительности. Полученные данные показывают, что ИИ достиг клинически значимой точности в некоторых областях; однако по таким направлениям, как доверие, интеграция, интерпретируемость и совместимость с рабочими процессами, сохраняются важные ограничения. Поэтому тему нужно оценивать не через технологический энтузиазм, а через диагностическую производительность и клиническую применимость.

1. Текущая производительность: какого уровня достиг ИИ?

Опубликованные в последние годы систематические обзоры и мета-анализы показывают, что ИИ в стоматологическом радиологическом анализе уже вышел за экспериментальные рамки. Umbrella review, охвативший 137 первичных исследований по обнаружению кариеса, сообщает пуловую чувствительность 0,85, специфичность 0,90 и AUC 0,86. Эти данные свидетельствуют о значимой диагностической способности, особенно на уровне скрининга и предварительной оценки.

Апроксимальный кариес на bitewing — чувствительность 0,94
Апроксимальный кариес на bitewing — специфичность 0,91

Источник: мета-анализ апроксимального кариеса, ScienceDirect 2024

Мета-анализ 2024 года об обнаружении апроксимального кариеса на bitewing-снимках даёт ещё более сильные результаты: чувствительность 0,94, специфичность 0,91. Это показывает, что ИИ способен эффективно исключать здоровые поверхности и выделять области возможного кариеса. Однако широкий разброс положительной прогностической ценности между исследованиями говорит: обнаруженные находки по-прежнему требуют подтверждения клиницистом.

В периапикальных поражениях картина более гетерогенна. По данным систематических обзоров, точность CNN-моделей варьируется от 70% до 99,65%. Широкие интервалы чувствительности и специфичности указывают: в этой области производительность сильно чувствительна к качеству набора данных, стандарту разметки и архитектуре модели. В случае потери пародонтальной кости наблюдается более стабильная производительность: в масштабных исследованиях AUC — 0,884–0,913, чувствительность — 88,8–90,7%. Однако относительно более низкая специфичность напоминает, что нагрузку ложных срабатываний нельзя игнорировать.

2. Почему вариабельность между клиницистами так важна?

Чтобы понять производительность ИИ, её нужно сравнивать не с теоретическим «идеальным диагнозом», а с реальной клинической практикой. Здесь вариабельность между клиницистами — одна из главных точек отсчёта. В исследовании надёжности, в котором 14 стоматологов оценивали 150 рентгенограмм, межэкспертная каппа Коэна для кариеса составила 0,659–0,704. Для периапикальных поражений этот показатель снижается до 0,611–0,643, для потери пародонтальной кости — до 0,454–0,482.

Смысл этих результатов ясен: интерпретация изображений, особенно в области потери кости и периапикального воспаления, не обеспечивает высокого уровня безусловного согласия. Также показано, что более опытные врачи дают более согласованные оценки. Поэтому ИИ-системы важны не только как инструмент «обнаружения правильных находок», но и как слой стандартизации, уменьшающий вариабельность.

"Более правильный вопрос — не 'превосходит ли ИИ специалиста?', а 'снижает ли ИИ вариацию в клинической практике?'"

Особенно для менее опытных клиницистов этот вклад ощутим. Литература показывает, что ИИ частично закрывает разрыв в опыте при обнаружении поражений и повышает уверенность в решениях при некоторых патологиях. Поэтому обсуждение производительности не следует сводить к вопросу «превосходит ли ИИ специалиста?». Более правильный вопрос — «снижает ли ИИ вариацию в клинической практике?».

3. Ошибки диагноза, задержки и качество отчётов

Ошибка диагноза в радиологическом анализе — не только теоретическая проблема производительности; она напрямую влияет на клинические исходы. Пропуск раннего кариеса, периапикальных поражений или потери пародонтальной кости может привести к задержке в планировании лечения, более инвазивным вмешательствам и ухудшению пациентского опыта. Поэтому важна не только точность диагноза, но и качество отчётности.

Клинический аудит 2025 года показал, что в интраоральных периапикальных радиологических отчётах студентов стоматологии локализация кариеса фиксировалась только в 60% случаев, детали реставраций документировались с точностью 42%, а доля повторных снимков достигала 65%. Эти выводы показывают, что проблема — не только в распознавании изображений; это проблема стандартизированной отчётности и дисциплины процесса.

ИИ может создавать ценность именно в этой точке. Потому что системы не только выявляют находки, но и обеспечивают стандартизацию отчётов, видимость пропусков и функцию второго читателя в рабочем процессе. Это особенно критично в загруженных клиниках или командах с разным уровнем подготовки.

4. ИИ: автономный инструмент диагностики или система поддержки принятия решений?

Текущие данные показывают, что сильнейшая позиция ИИ — не автономный принимающий решения, а дополнительная система поддержки принятия решений. Систематические обзоры подчёркивают, что, особенно при обнаружении кариеса, ИИ хорошо исключает здоровые поверхности, но положительные находки требуют подтверждения специалистом. Эта рамка предлагает более реалистичную модель клинического использования.

Регуляторная сторона также поддерживает это направление. Тот факт, что крупнейшая часть одобренных FDA 510(k) в 2011–2024 годах стоматологических ИИ/ML-устройств сосредоточена в оральной радиологии, свидетельствует о зрелости области. Однако рост числа одобренных устройств не означает, что их массовое внедрение происходит с той же скоростью. Потому что расстояние между технической точностью и повседневным использованием определяется интеграцией, обучением и доверием.

Поэтому наиболее сильная роль ИИ в клинике — не замена врача, а приоритизация, второй контроль, выделение труднозаметных зон и поддержка стандарта отчётности.

5. Реальные пределы: доверие, прозрачность и интеграция

3,8%
Доверие стоматологов к полностью автоматическим диагностическим решениям ИИ. Источник: J. Medicine and Life / PMC, 2025

Главное, что тормозит внедрение технологии, — не столько дефицит производительности, сколько архитектура доверия. В опросах доля стоматологов, доверяющих полностью автоматическим диагностическим решениям ИИ, составляет всего 3,8%. Подавляющее большинство предпочитает, чтобы финальный диагноз ставил человек-клиницист. Это показывает, что врачи не закрыты для ИИ; они ставят его не в центр решения, а на его периферию.

У этой осторожности несколько причин. Первая — проблема «чёрного ящика»: модели глубокого обучения часто не могут наглядно объяснить путь к результату. Вторая — проблема интеграции. Отсутствие стандартной совместимости между визуализационным оборудованием, системами типа PACS и программами управления пациентами затрудняет превращение технической ценности в рабочий процесс. Третья — регуляторная и правовая рамка. Когда программное обеспечение считается медицинским устройством, появляется неопределённость в распределении ответственности при ошибке.

Таким образом, текущая картина указывает не на вывод «ИИ недостаточно хорош», а на вывод «даже если он достаточно хорош, нужно прояснить, как использовать его надёжно и интегрированно».

Заключение

ИИ-системы анализа изображений в стоматологии достигли клинически значимых уровней производительности, особенно в обнаружении кариеса, анализе периапикальных поражений и измерении потери пародонтальной кости. Чувствительность, специфичность и AUC во многих подобластях сильны. Но эта производительность лучше подходит для систем поддержки принятия решений, чем для полностью автономной диагностики.

Истинная ценность — не в том, что ИИ «решает» невидимое в одиночку; она в снижении вариабельности между клиницистами, в усилении стандарта отчётности и, особенно для менее опытных пользователей, в создании второго слоя чтения. В ближайшей перспективе решающим вопросом будет не гонка производительности, а то, как эти системы будут надёжно, объяснимо и интегрированно встроены в рабочий процесс.