“Si en un día y medio, con la ayuda de un científico de datos, hemos conseguido generar conocimiento a partir de una base de datos gigantesca de pacientes ingresados en UCI, qué seríamos capaces de hacer si en los hospitales tuviéramos un equipo estable de científicos de datos que trabajasen de forma colaborativa con nuestros médicos”.
Tal reflexión, de un responsable de una Unidad de Cuidados Intensivos de un hospital de referencia, se producía en el marco del Congreso internacional sobre Cuidados críticos -Critical Care Summit- los días 8 y 9 de noviembre, que acogía a su vez al 2º Datathon sanitario #TGNdatathon2018, tras la exitosa primera edición celebrada en Madrid.
Coordinado por investigadores del Instituto Tecnológico de Massachussets (MIT) y aprovechando la presencia de médicos expertos en cuidados intensivos de toda España reunidos en el marco del congreso internacional, expertos y principiantes clínicos y científicos de datos volvían a acceder a las dos bases de datos más importantes con información de cuidados intensivos de hospitales de Estados Unidos (MIMIC III y eICU) para, utilizando metodologías ágiles, trabajar de forma multidisciplinar planteando respuestas a retos complejos, utilizando tecnología big data para el procesamiento masivo de información, análisis y entrenamiento de modelos predictivos. Todo ello, en un fin de semana. Los días 10 y 11 de noviembre.
El planteamiento que realizamos para dar respuesta al reto “Prediction of individualized goals for urine output”, -y con el que mi equipo, integrado por el Dr. Sirgo, médico experto en UCI del Hospital Universitario Joan XXIII y tres científicos de datos de Barcelona, logró el tercer premio-, fue fijar como objetivo encontrar los factores más relevantes para predecir si un paciente no crónico ingresado en la UCI, con insuficiencia aguda de riñón (AKI) acabaría en diálisis. De esta forma se podrían gestionar mejor los recursos necesarios, o bien, tomar alguna acción para mejorar el estado del paciente, con los beneficios que ello puede suponer respecto a su salud y en la mejora en la eficiencia del servicio, reduciendo el tiempo de ingreso y las posibles complicaciones con eficiencia en costes.
Para ello seleccionamos la base de datos eICU que, si bien podía tener menor calidad debido a que procedía de más de 200 UCI diferentes, tenía una mayor volumetría que MIMIC III -Medical Information Mart for Intensive Care, que alberta datos sobre 40.000 pacientes admitidos en UCI en el Centro Médico Beth Israel Deaconess desde el año 2000-, debido a que, para crear el modelo predictivo era necesario contar con el mayor número de casos posibles, siempre teniendo en cuenta la calidad del dato. Como infraestructura de almacenamiento y procesamiento utilizamos Google Cloud; para la extracción de datos utilizamos secuencias SQL sobre Bigtable, y como herramienta de análisis utilizamos Collab con Python 3 sobre Google Cloud.
Las características más relevantes que obtuvimos para crear los modelos predictivos fueron los datos demográficos, balance hídrico, estado hemodinámico, datos bioquímicos -creatinina, K,…- y medicamentos vasoactivos. Finalmente creamos los modelos predictivos con los siguientes tipos de algoritmos: SVM, Regresiones Logísticas, Random Forest, KNN, Gaussian Naive Bayes, Stochastic Gradiant Descent.
Debido al limitado tiempo para realizar todo el estudio pudimos obtener una primera aproximación a la precisión en cada uno de los algoritmos, obteniendo con KNN el mejor resultado con el conjunto de datos utilizado.
El futuro en el análisis de datos sanitarios nos deparará grandes avances
Hasta la fecha, apenas hemos aprovechado la generación de conocimiento partiendo de datos históricos de pacientes ingresado en UCI, debido a motivos como el cumplimiento legal para acceder a datos de salud especialmente protegidos, la gobernanza del dato en las organizaciones, la calidad de los datos procedentes de diferentes dispositivos médicos de fabricantes, el volumen de los mismos para gestionar su almacenamiento y procesamiento y, sobre todo, la falta de talento experto en análisis de datos, como son los científicos de datos en el ámbito sanitario.
Pero, recientemente, han surgido factores que auguran grandes avances en el análisis de datos sanitarios, en parte debido a la “tormenta perfecta” que se ha producido con la aparición del cloud computing, la moda de los científicos de datos y los movimientos colaborativos, como el datathon, junto con la inteligencia artificial, el IoT y la necesaria sostenibilidad del sistema sanitario.
Porque los retos de futuro son muy numerosos, empezando por la legislación y el gobierno de la información, hasta la captación de talento para el ámbito sanitario. En cuidados intensivos se generará conocimiento y se crearán modelos predictivos que van a permitir a los médicos adelantarse a los eventos críticos para mejorar la eficiencia, y sobre todo, permitiendo salvar vidas con las mínimas secuelas.
Trabajo colaborativo y multidisciplinar
Por estas razones quiero destacar, no sólo el apoyo de los expertos del MIT, que nos han mentorizado y ayudado en todo el proceso, desde el acceso a los datos, la definición de casos de uso, la analítica de datos, así como la creación y validación de los modelos predictivos.
También la colaboración multidisciplinar. Un aspecto especialmente enriquecedor de la experiencia vivida en este datathon ha sido el ambiente de trabajo en equipo entre participantes llegados de diferentes ciudades de España, Estados Unidos, Reino Unido, Colombia, Argentina o Brasil para aprender más sobre datos e intentar vislumbrar un futuro que apunta hacia un aumento del número de profesiones nuevas, como los científicos de datos, ingenieros de datos y expertos en inteligencia artificial, y hacia una sanidad más eficiente, más sostenible y centrada en el paciente.
Fuente: https://www.iecisa.com