Estimado Editor
El dolor lumbosacro, puede ser, quizás, una de las manifestaciones más discapacitantes en medicina1. Su abordaje preciso y oportuno es esencial para reducir la magnitud del dolor y promover la pérdida de la capacidad funcional. Las degeneraciones y hernias discales están dentro de las causas más comunes neurológicamente1. El diagnóstico específico es fundamental para poder definir la intervención o resolución definitiva. Con la inclusión de la inteligencia artificial en la biomedicina y, más específicamente en la radiología, se han propuesto modelos y algoritmos para mejorar el rendimiento diagnóstico de este tipo de condiciones2. No obstante, para definir su uso masivo en radiología, es necesario contar con resultados definitivos, reproducibles y costo-efectivos, que puedan sustentar una posible superioridad frente a la valoración tradicional humana.
Recientemente, Compte et al3 llevaron a cabo un metaanálisis, donde buscaron determinar si los algoritmos de aprendizaje automático actuales poseen un rendimiento comparable al del radiólogo, para identificar degeneración y hernia discal. Los autores incluyeron 27 estudios, los cuales utilizaron a su vez, un gran número de modelos de aprendizaje basado en inteligencia artificial, para el diagnóstico de estas condiciones. Luego del análisis global, se identificó un promedio de precisión del 87%, especificidad del 90,4%, y sensibilidad del 88,2%, para el diagnóstico de alteraciones discales a partir de estos modelos. Puntualmente, la sensibilidad para los diagnósticos de hernia y degeneración discal, oscilaron entre 0,59 y 1, y entre 0,73 y 0,97, respectivamente. La especificidad, para ambas condiciones, obtuvo valores de 0,68 y 1, y de 0,78 y 0,94, respectivamente3. No obstante, observaciones de los investigadores, sobre tamaño de muestra y omisión de datos de los participantes, redujeron la precisión de la evidencia. Así, concluyeron que, a pesar del avance significativo en el uso de estos modelos para la valoración radiológica de discopatías, aún no es comparable a la evaluación tradicional, considerando las limitaciones. Sugirieron su uso supervisado o complementado con la evaluación tradicional, para mejorar la precisión y acelerar el tiempo de evaluación 3.
D'Antoni et al4 realizaron una revisión sistemática con el objetivo de evaluar el impacto del diagnóstico basado en inteligencia artificial y los desenlaces de tratamiento para dolor lumbosacro. Los autores incluyeron 57 estudios que les permitieron identificar que este tipo de modelos se han estudiado y usado más comúnmente para clasificación de la enfermedad y regresión de medidas cuantitativas. Particularmente, el mejor rendimiento fue encontrado para la evaluación de degeneración discal (>80%)4. Sin embargo, los investigadores resaltan que esos estudios no consideran numerosas variables, tales como electrofisiológicas, biomecánicas, clínicas y funcionales, las cuales son útiles para la clasificación, diagnóstico y pronóstico de enfermedad4.
En este orden de ideas, aunque es notable un avance computacional en la integración de modelos basados en inteligencia artificial y aprendizaje automático en biomedicina, específicamente con la evaluación y precisión de hernia y degeneración discal, aún existen limitaciones propias del crecimiento científico y tecnológico que impiden su masificación5. Por lo tanto, no se puede afirmar que existe superioridad de la inteligencia artificial comparada a la valoración humana tradicional, que finalmente integra otras herramientas para el diagnóstico y abordaje de este tipo de condiciones. Posiblemente, el paso a seguir sea la integración supervisada o complementación junto a la lectura humana.