banner de página

noticias

Desde que IBM Watson comenzó a operar en 2007, la humanidad ha estado en constante búsqueda del desarrollo de la inteligencia artificial (IA) médica. Un sistema de IA médica utilizable y potente tiene un enorme potencial para transformar todos los aspectos de la medicina moderna, permitiendo una atención más inteligente, precisa, eficiente e inclusiva, brindando bienestar a profesionales sanitarios y pacientes, y, por consiguiente, mejorando significativamente la salud humana. En los últimos 16 años, si bien los investigadores en IA médica han acumulado experiencia en diversos campos pequeños, aún no han logrado convertir la ciencia ficción en realidad.

Este año, con el desarrollo revolucionario de la tecnología de IA como ChatGPT, la IA médica ha logrado un gran progreso en muchos aspectos. Un avance sin precedentes en la capacidad de la IA médica: la revista Nature ha lanzado continuamente la investigación del modelo de lenguaje grande médico y el modelo básico de imagen médica; Google lanza Med-PaLM y su sucesor, alcanzando un nivel experto en las preguntas del examen de practicante médico de EE. UU. Las principales revistas académicas se centrarán en la IA médica: Nature publica la perspectiva sobre el modelo básico de la IA médica general; Tras una serie de revisiones de IA en Medicina a principios de este año, el New England Journal of Medicine (NEJM) publicó su primera revisión de salud digital el 30 de noviembre y lanzó el primer número de la subrevista NEJM AI el 12 de diciembre. El suelo de aterrizaje de la IA médica está más maduro: la subrevista JAMA publicó la iniciativa global de intercambio de datos de imágenes médicas; La Administración de Alimentos y Medicamentos de EE. UU. (FDA) está desarrollando un borrador de pautas para la regulación de la IA médica.

A continuación, revisamos el progreso significativo que los investigadores de todo el mundo han logrado en la dirección de una IA médica utilizable en 2023.

801

Modelo básico de IA médica

La construcción del modelo básico de IA médica es sin duda el foco de investigación más candente de este año. Las revistas Nature han publicado artículos de revisión sobre el modelo básico universal de atención médica y el modelo de lenguaje grande de atención médica durante el año. Medical Image Analysis, la revista líder en la industria, revisó y anticipó los desafíos y oportunidades de la investigación del modelo básico en el análisis de imágenes médicas, y propuso el concepto de "pedigrí del modelo básico" para resumir y guiar el desarrollo de la investigación del modelo básico de IA médica. El futuro de los modelos básicos de IA para la atención médica es cada vez más claro. Basándose en los ejemplos exitosos de modelos de lenguaje grande como ChatGPT, utilizando métodos de preentrenamiento autosupervisados ​​más avanzados y una vasta acumulación de datos de entrenamiento, los investigadores en el campo de la IA médica están tratando de construir 1) modelos base específicos de la enfermedad, 2) modelos base generales y 3) modelos grandes multimodales que integran una amplia gama de modos con parámetros masivos y capacidades superiores.

Modelo de IA para adquisición de datos médicos

Además de los grandes modelos de IA que desempeñan un papel fundamental en las tareas posteriores de análisis de datos clínicos, en la adquisición de datos clínicos preliminares también ha surgido la tecnología de los modelos de IA generativos. El proceso, la velocidad y la calidad de la adquisición de datos pueden mejorarse significativamente mediante algoritmos de IA.

 

A principios de este año, Nature Biomedical Engineering publicó un estudio de la Universidad del Estrecho de Turquía centrado en el uso de IA generativa para resolver el problema del diagnóstico patológico asistido por imágenes en aplicaciones clínicas. Los artefactos en el tejido de secciones congeladas durante la cirugía constituyen un obstáculo para una evaluación diagnóstica rápida. Si bien el tejido embebido en formalina y parafina (FFPE) proporciona una muestra de mayor calidad, su proceso de producción es lento y suele tardar entre 12 y 48 horas, lo que lo hace inadecuado para su uso en cirugía. Por lo tanto, el equipo de investigación propuso un algoritmo llamado AI-FFPE, que puede lograr que la apariencia del tejido en la sección congelada sea similar a la del FFPE. El algoritmo corrigió con éxito los artefactos de las secciones congeladas, mejoró la calidad de la imagen y conservó las características clínicamente relevantes al mismo tiempo. En la validación clínica, el algoritmo AI-FFPE mejora significativamente la precisión diagnóstica de los patólogos para los subtipos de tumores, a la vez que acorta considerablemente el tiempo de diagnóstico clínico.

Cell Reports Medicine informa sobre un trabajo de investigación realizado por un equipo del Tercer Colegio Clínico de la Universidad de Jilin, el Departamento de Radiología del Hospital Zhongshan Afiliado a la Universidad de Fudan y la Universidad de Ciencia y Tecnología de Shanghái [25]. Este estudio propone un marco de fusión de reconstrucción iterativa y aprendizaje profundo de propósito general (DL-IR híbrido) con alta versatilidad y flexibilidad, que muestra un excelente rendimiento de reconstrucción de imágenes en resonancia magnética rápida, tomografía computarizada de baja dosis y tomografía por emisión de positrones rápida. El algoritmo puede lograr un escaneo multisecuencia de un solo órgano por resonancia magnética en 100 segundos, reducir la dosis de radiación a solo el 10% de la imagen de tomografía computarizada, eliminar el ruido y puede reconstruir pequeñas lesiones a partir de la adquisición de tomografía por emisión de positrones con una aceleración de 2 a 4 veces, al tiempo que reduce el efecto de los artefactos de movimiento.

IA médica en colaboración con profesionales sanitarios

El rápido desarrollo de la IA médica también ha llevado a los profesionales médicos a considerar y explorar seriamente cómo colaborar con la IA para mejorar los procesos clínicos. En julio de este año, DeepMind y un equipo de investigación multiinstitucional propusieron conjuntamente un sistema de IA llamado Complementary Driven Clinical Workflow Delay (CoDoC). El proceso de diagnóstico es diagnosticado primero por un sistema de IA predictivo, luego juzgado por otro sistema de IA sobre el resultado anterior, y si hay dudas, el diagnóstico es finalmente realizado por un médico para mejorar la precisión del diagnóstico y equilibrar la eficiencia. Cuando se trata de la detección del cáncer de mama, CoDoC redujo las tasas de falsos positivos en un 25% con la misma tasa de falsos negativos, al tiempo que redujo la carga de trabajo del médico en un 66%, en comparación con el actual proceso de "arbitraje de doble lectura" en el Reino Unido. En términos de clasificación de TB, las tasas de falsos positivos se redujeron entre un 5 y un 15 por ciento con la misma tasa de falsos negativos en comparación con la IA independiente y los flujos de trabajo clínicos.

De manera similar, Annie Y. Ng et al., de Kheiron Company en Londres, Reino Unido, introdujeron lectores de IA adicionales (en cooperación con examinadores humanos) para volver a examinar los resultados cuando no había resultados de recuperación en el proceso de arbitraje de doble lectura, lo que mejoró el problema de la detección omitida en la detección temprana del cáncer de mama, y ​​el proceso casi no tuvo falsos positivos. Otro estudio, dirigido por un equipo de la Facultad de Medicina McGovern de la Universidad de Texas y completado en cuatro centros de accidentes cerebrovasculares, aplicó tecnología de IA basada en angiografía por tomografía computarizada (ATC) para automatizar la detección de accidentes cerebrovasculares isquémicos oclusivos vasculares grandes (OVG). Los médicos y radiólogos reciben alertas en tiempo real en sus teléfonos móviles a los pocos minutos de que se complete la obtención de imágenes por TC, notificándoles de la posible presencia de OVG. Este proceso de IA mejora los flujos de trabajo intrahospitalarios para accidentes cerebrovasculares isquémicos agudos, reduciendo el tiempo puerta a ingle desde el ingreso hasta el tratamiento y brindando oportunidades para un rescate exitoso. Los hallazgos se publican en JAMA Neurology.

Un modelo de atención sanitaria basado en IA para un beneficio universal

En 2023, se desarrollará una gran cantidad de trabajos de calidad que utilizan la IA médica para detectar características invisibles para el ojo humano a partir de datos más accesibles, lo que permitirá un diagnóstico universal y una detección temprana a gran escala. A principios de año, Nature Medicine publicó estudios realizados por el Centro Oftalmológico Zhongshan de la Universidad Sun Yat-sen y el Segundo Hospital Afiliado de la Universidad Médica de Fujian. Utilizando teléfonos inteligentes como terminales de aplicación, utilizaron imágenes de video similares a dibujos animados para inducir la mirada de los niños y registrar su comportamiento y rasgos faciales. Además, analizaron modelos anormales mediante modelos de aprendizaje profundo para identificar con éxito 16 enfermedades oculares, como cataratas congénitas, ptosis congénita y glaucoma congénito, con una precisión de detección promedio superior al 85 %. Esto proporciona un medio técnico eficaz y fácil de popularizar para la detección temprana a gran escala del deterioro de la función visual infantil y enfermedades oculares relacionadas.

A finales de año, Nature Medicine publicó un trabajo realizado por más de 10 instituciones médicas y de investigación de todo el mundo, entre ellas el Instituto de Enfermedades Pancreáticas de Shanghái y el Primer Hospital Afiliado de la Universidad de Zhejiang. El autor aplicó IA al cribado de cáncer de páncreas en personas asintomáticas en centros de reconocimiento médico, hospitales, etc., para detectar las características de las lesiones en imágenes de TC simples que son difíciles de detectar a simple vista, con el fin de lograr una detección temprana eficiente y no invasiva del cáncer de páncreas. Al revisar los datos de más de 20 000 pacientes, el modelo también identificó 31 casos de lesiones clínicamente inadvertidas, lo que mejoró significativamente los resultados clínicos.

Intercambio de datos médicos

En 2023, han surgido en todo el mundo muchos más mecanismos perfectos de intercambio de datos y casos exitosos, lo que garantiza la cooperación multicéntrica y la apertura de datos bajo la premisa de proteger la privacidad y la seguridad de los datos.

En primer lugar, con la ayuda de la propia tecnología de IA, los investigadores de IA han contribuido al intercambio de datos médicos. Qi Chang y otros investigadores de la Universidad de Rutgers (Estados Unidos) publicaron un artículo en Nature Communications en el que proponían un marco de aprendizaje federal (DSL) basado en redes sintéticas antagónicas distribuidas. Este marco utiliza IA generativa para entrenar los datos generados específicos de centros multicéntricos y, posteriormente, reemplaza los datos reales de estos con los datos generados. Garantizar el entrenamiento de IA basado en big data multicéntrico, protegiendo al mismo tiempo la privacidad de los datos. El mismo equipo también publicó en código abierto un conjunto de datos de imágenes patológicas generadas y sus anotaciones correspondientes. El modelo de segmentación entrenado con el conjunto de datos generados puede lograr resultados similares a los de los datos reales.

El equipo de Dai Qionghai, de la Universidad de Tsinghua, publicó un artículo en npj Digital Health, donde propone el aprendizaje por retransmisión. Este método utiliza big data multisitio para entrenar modelos de IA bajo la premisa de soberanía local de datos y ausencia de conexión de red entre sitios. Equilibra la seguridad y la privacidad de los datos con la búsqueda del rendimiento de la IA. Posteriormente, el mismo equipo desarrolló y validó conjuntamente CAIMEN, un sistema de diagnóstico de tumores panmediastínicos mediante TC de tórax basado en el aprendizaje federal, en colaboración con el Primer Hospital Afiliado de la Universidad Médica de Guangzhou y 24 hospitales de todo el país. El sistema, aplicable a 12 tumores mediastínicos comunes, logró una precisión un 44,9 % superior cuando se utilizó solo que cuando lo utilizaron solo expertos humanos, y una precisión diagnóstica un 19 % superior cuando contó con la asistencia de expertos humanos.

Por otro lado, varias iniciativas están en marcha para construir conjuntos de datos médicos seguros, globales y a gran escala. En noviembre de 2023, Agustina Saenz y otros del Departamento de Informática Biomédica de la Facultad de Medicina de Harvard publicaron en línea en Lancet Digital Health un marco global para compartir datos de imágenes médicas llamado Datos de Inteligencia Artificial para Toda la Atención Médica (MAIDA). Están trabajando con organizaciones de atención médica de todo el mundo para proporcionar una guía integral sobre la recopilación y desidentificación de datos, utilizando la plantilla del Socio de Demostración Federal (FDP) de EE. UU. para estandarizar el intercambio de datos. Planean publicar gradualmente conjuntos de datos recopilados en diferentes regiones y entornos clínicos en todo el mundo. Se espera que el primer conjunto de datos se publique a principios de 2024, y se añadirán más a medida que la asociación se expanda. El proyecto es un intento importante de construir un conjunto global, a gran escala y diverso de datos de IA disponibles públicamente.

Tras la propuesta, el Biobanco del Reino Unido ha dado ejemplo. El 30 de noviembre, publicó nuevos datos de la secuenciación completa del genoma de sus 500.000 participantes. Esta base de datos, que publica la secuencia completa del genoma de cada uno de los 500.000 voluntarios británicos, es la mayor del mundo en cuanto a genoma humano. Investigadores de todo el mundo pueden solicitar acceso a estos datos anónimos y utilizarlos para investigar la base genética de la salud y la enfermedad. Los datos genéticos siempre han sido muy sensibles para su verificación, y este logro histórico del Biobanco del Reino Unido demuestra que es posible crear una base de datos global, abierta y sin restricciones de privacidad. Con esta tecnología y base de datos, la IA médica está llamada a dar el siguiente paso.

Verificación y evaluación de la IA médica

En comparación con el rápido desarrollo de la tecnología de IA médica, el desarrollo de la verificación y evaluación de la IA médica es ligeramente lento. La validación y la evaluación en el campo general de la IA a menudo ignoran las necesidades reales de los médicos y los pacientes. Los ensayos clínicos controlados aleatorizados tradicionales son demasiado laboriosos para igualar la rápida iteración de las herramientas de IA. Mejorar cuanto antes el sistema de verificación y evaluación adecuado para las herramientas de IA médica es fundamental para impulsar la IA médica y que realmente impulse la investigación y el desarrollo hacia la práctica clínica.

En el artículo de investigación de Google sobre Med-PaLM, publicado en Nature, el equipo también publicó el punto de referencia de evaluación MultiMedQA, que se utiliza para evaluar la capacidad de los modelos lingüísticos de gran tamaño para adquirir conocimiento clínico. Este punto de referencia combina seis conjuntos de datos de preguntas y respuestas médicas profesionales existentes, que abarcan el conocimiento médico profesional, la investigación y otros aspectos, así como una base de datos de preguntas médicas de búsqueda en línea que considera las preguntas y respuestas en línea entre médico y paciente, con el objetivo de capacitar a la IA para convertirse en un médico cualificado desde diversos puntos de vista. Además, el equipo propone un marco basado en la evaluación humana que considera múltiples dimensiones de hechos, comprensión, razonamiento y posibles sesgos. Este es uno de los esfuerzos de investigación más representativos para evaluar la IA en el ámbito sanitario publicados este año.

Sin embargo, ¿el hecho de que los modelos de lenguaje grandes muestren un alto nivel de conocimiento clínico de codificación significa que los modelos de lenguaje grandes son competentes para tareas clínicas del mundo real? Así como un estudiante de medicina que aprueba el examen de médico profesional con una puntuación perfecta aún está lejos de ser un médico jefe en solitario, los criterios de evaluación propuestos por Google pueden no ser una respuesta perfecta al tema de la evaluación de IA médica para modelos de IA. Ya en 2021 y 2022, investigadores propusieron pautas de informes como Decid-AI, SPIRIT-AI e INTRPRT, con la esperanza de guiar el desarrollo temprano y la validación de la IA médica bajo la condición de considerar factores como la practicidad clínica, la seguridad, los factores humanos y la transparencia/interpretabilidad. Recientemente, la revista Nature Medicine publicó un estudio realizado por investigadores de la Universidad de Oxford y la Universidad de Stanford sobre si utilizar "validación externa" o "validación local recurrente" para validar las herramientas de IA.

La imparcialidad de las herramientas de IA también es una importante línea de evaluación que ha recibido atención este año en artículos de Science y NEJM. La IA suele presentar sesgos porque se limita a los datos de entrenamiento. Este sesgo puede reflejar desigualdad social, que a su vez deriva en discriminación algorítmica. Los Institutos Nacionales de Salud lanzaron recientemente la iniciativa Bridge2AI, con un coste estimado de 130 millones de dólares, para crear conjuntos de datos diversos (en consonancia con los objetivos de la iniciativa MAIDA mencionada anteriormente) que puedan utilizarse para validar la imparcialidad de las herramientas de IA médica. MultiMedQA no considera estos aspectos. La cuestión de cómo medir y validar los modelos de IA médica aún requiere un debate amplio y profundo.

En enero, Nature Medicine publicó un artículo de opinión titulado "La próxima generación de la medicina basada en la evidencia", escrito por Vivek Subbiah, del Centro Oncológico MD Anderson de la Universidad de Texas. En él, se analizan las limitaciones de los ensayos clínicos expuestas en el contexto de la pandemia de COVID-19 y se señala la contradicción entre la innovación y la adherencia al proceso de investigación clínica. Finalmente, se señala un futuro de reestructuración de los ensayos clínicos: la próxima generación de ensayos clínicos que utilizan inteligencia artificial, es decir, el uso de inteligencia artificial a partir de una gran cantidad de datos históricos de investigación, datos del mundo real, datos clínicos multimodales y datos de dispositivos portátiles para encontrar evidencia clave. ¿Significa esto que la tecnología de IA y los procesos de validación clínica de IA podrían reforzarse mutuamente y coevolucionar en el futuro? Esta es la pregunta abierta y estimulante de 2023.

Regulación de la IA médica

El avance de la tecnología de IA también plantea desafíos para la regulación de la IA, y los legisladores de todo el mundo están respondiendo con cautela y cuidado. En 2019, la FDA publicó por primera vez un Marco Regulatorio Propuesto para Cambios de Software en Dispositivos Médicos de Inteligencia Artificial (Borrador de Debate), detallando su posible enfoque para la revisión previa a la comercialización de las modificaciones de software impulsadas por IA y aprendizaje automático. En 2021, la FDA propuso el "Software basado en Inteligencia Artificial/Aprendizaje Automático como Plan de Acción para Dispositivos Médicos", que aclaró cinco medidas regulatorias médicas específicas de IA. Este año, la FDA volvió a publicar la Presentación Previa a la Comercialización de Características de Software de Dispositivos para proporcionar información sobre las recomendaciones de presentación previa a la comercialización para la evaluación de la FDA de la seguridad y eficacia de las características de software de los dispositivos, incluidas algunas características de dispositivos de software que utilizan modelos de aprendizaje automático entrenados a través de métodos de aprendizaje automático. La política regulatoria de la FDA ha evolucionado de una propuesta inicial a una guía práctica.

Tras la publicación del Espacio Europeo de Datos Sanitarios en julio del año pasado, la UE ha vuelto a promulgar la Ley de Inteligencia Artificial. La primera tiene como objetivo optimizar el uso de los datos sanitarios para proporcionar una atención sanitaria de alta calidad, reducir las desigualdades y respaldar los datos para la prevención, el diagnóstico, el tratamiento, la innovación científica, la toma de decisiones y la legislación, garantizando al mismo tiempo que los ciudadanos de la UE tengan un mayor control sobre sus datos sanitarios personales. La segunda deja claro que el sistema de diagnóstico médico es un sistema de IA de alto riesgo y que necesita adoptar una supervisión sólida y específica, una supervisión del ciclo de vida completo y una supervisión previa a la evaluación. La Agencia Europea de Medicamentos (EMA) ha publicado un borrador de documento de reflexión sobre el uso de la IA para respaldar el desarrollo, la regulación y el uso de fármacos, con énfasis en mejorar la credibilidad de la IA para garantizar la seguridad del paciente y la integridad de los resultados de la investigación clínica. En general, el enfoque regulatorio de la UE está tomando forma gradualmente, y los detalles finales de implementación pueden ser más detallados y estrictos. En marcado contraste con la estricta regulación de la UE, el plan regulatorio de IA del Reino Unido deja claro que el gobierno planea adoptar un enfoque suave y no promulgar nuevos proyectos de ley ni establecer nuevos reguladores por ahora.

En China, el Centro de Revisión Técnica de Dispositivos Médicos (NMPA) de la Administración Nacional de Productos Médicos ha publicado previamente documentos como “Puntos de revisión del software de decisión asistida por aprendizaje profundo”, “Principios rectores para la revisión del registro de dispositivos médicos de inteligencia artificial (borrador para comentarios)” y “Circular sobre los principios rectores para la clasificación y definición de productos de software médico de inteligencia artificial (n.° 47 en 2021)”. Este año, se publicó nuevamente el "Resumen de los primeros resultados de la clasificación de productos de dispositivos médicos en 2023". Esta serie de documentos simplifica y aclara la definición, clasificación y regulación de los productos de software médico de inteligencia artificial, y proporciona una guía clara para el posicionamiento de productos y las estrategias de registro de diversas empresas del sector. Estos documentos proporcionan un marco y decisiones de gestión para la regulación científica de los dispositivos médicos de IA. Cabe esperar que la agenda de la Conferencia de Inteligencia Artificial Médica de China, celebrada en Hangzhou del 21 al 23 de diciembre, incluya un foro especial sobre gobernanza médica digital y desarrollo de alta calidad de hospitales públicos, así como un foro para el desarrollo de la industria de estandarización de la tecnología de prueba y evaluación de dispositivos médicos de inteligencia artificial. En esa ocasión, funcionarios de la Comisión Nacional de Desarrollo y Reforma y de la NMPA asistirán a la reunión y podrían publicar nueva información.

Conclusión

En 2023, la IA médica ha comenzado a integrarse en todos los procesos médicos, tanto iniciales como posteriores, abarcando la recopilación, fusión, análisis, diagnóstico y tratamiento de datos hospitalarios, así como el cribado comunitario. Además, colabora de forma orgánica con el personal médico y de control de enfermedades, demostrando así su potencial para mejorar la salud humana. La investigación en IA médica práctica está comenzando a despuntar. En el futuro, el progreso de la IA médica no solo depende del propio desarrollo tecnológico, sino que también requiere la plena cooperación de la industria, la universidad y la investigación médica, así como el apoyo de los responsables políticos y los organismos reguladores. Esta colaboración interdisciplinaria es clave para lograr servicios médicos integrados con IA y, sin duda, promoverá el desarrollo de la salud humana.


Hora de publicación: 30 de diciembre de 2023