
Prediciendo el brote de coronavirus: Cómo la IA conecta los puntos para advertir sobre las amenazas de enfermedades
El día de ayer, Viernes 6 de Marzo de 2020, se ha registrado el primer caso en Colombia de Covid19, o Coronavirus. Pero ahora, ¿cómo la Inteligencia Artificial ha ayudado a predecir el comportamiento del virus?
Para iniciar, la empresa canadiense de inteligencia artificial BlueDot ha sido noticia en las últimas semanas por haber advertido sobre el nuevo coronavirus días antes de las alertas oficiales de los Centros para el Control y la Prevención de Enfermedades y la Organización Mundial de la Salud. La empresa pudo hacerlo aprovechando diferentes fuentes de información más allá de las estadísticas oficiales sobre el número de casos reportados.
El algoritmo de IA de BlueDot, un tipo de programa informático que mejora a medida que procesa más datos, reúne noticias en docenas de idiomas, informes de redes de seguimiento de enfermedades de plantas y animales y datos de boletos de avión. El resultado es un algoritmo óptimo para simular la propagación de enfermedades, y mucho mejor que los algoritmos que se basan en datos de salud pública, lo que es lo suficientemente bueno para poder predecir brotes. La compañía usa la tecnología para predecir y rastrear enfermedades infecciosas para sus clientes del gobierno y del sector privado.
La epidemiología tradicional rastrea dónde y cuándo las personas contraen una enfermedad para identificar la fuente del brote y qué poblaciones corren mayor riesgo. Los sistemas de IA, como el modelo de BlueDot, alertan sobre cómo se propagan las enfermedades en las poblaciones, permitiendo predecir dónde ocurrirán los brotes y pronosticar cuán lejos y rápido se propagarán las enfermedades. Así que mientras el CDC y los laboratorios de todo el mundo corren para encontrar curas para el nuevo coronavirus, los investigadores están usando la IA para tratar de predecir a dónde irá la enfermedad y cuánto impacto podría tener. Ambos juegan un papel clave para hacer frente a la enfermedad.
Sin embargo, la IA no es una bala de plata. La precisión de los sistemas de IA depende en gran medida de la cantidad y la calidad de los datos de los que aprenden. Y la forma en que los sistemas de IA se diseñan y entrenan puede plantear cuestiones éticas, que pueden ser particularmente problemáticas cuando las tecnologías afectan a grandes franjas de una población sobre algo tan vital como la salud pública.
Todo se trata de los datos
El análisis tradicional de brotes de enfermedades examina la ubicación de un brote, el número de casos de enfermedad y el período de tiempo -el dónde, el qué y el cuándo- para pronosticar la probabilidad de que la enfermedad se extienda en un corto período de tiempo.
Los esfuerzos más recientes que utilizan la IA y la ciencia de los datos han ampliado su base de conocimiento para incluir muchas fuentes de datos diferentes, lo que permite hacer predicciones sobre los brotes. Con el advenimiento de Facebook, Twitter y otros sitios sociales y de micro-medios, cada vez más datos pueden ser asociados con una ubicación y minados para el conocimiento de un evento como un brote. Los datos pueden incluir discusiones en foros de trabajadores médicos sobre casos respiratorios inusuales y publicaciones en medios sociales sobre estar enfermo.
Muchos de estos datos están muy desestructurados, lo que significa que los computadores no pueden comprenderlos fácilmente. Los datos no estructurados pueden ser en forma de noticias, mapas de vuelo, mensajes en los medios de comunicación social, registros de personas, vídeos e imágenes. Por otra parte, los datos estructurados, como el número de casos notificados por ubicación, están más tabulados y por lo general no necesitan tanto preprocesamiento para que los computadores puedan interpretarlos.
Las técnicas más recientes, como el aprendizaje profundo, pueden ayudar a dar sentido a los datos no estructurados. Estos algoritmos se ejecutan en redes neuronales artificiales, que consisten en miles de pequeños procesadores interconectados, muy parecidos a las neuronas del cerebro. Los procesadores están dispuestos en capas, y los datos se evalúan en cada capa y se descartan o pasan a la siguiente capa. Al ciclar los datos a través de las capas en un bucle de retroalimentación, un algoritmo de aprendizaje profundo aprende cómo, por ejemplo, identificar a los gatos en los vídeos de YouTube.
Los investigadores enseñan a los algoritmos de aprendizaje profundo a comprender los datos no estructurados entrenándolos para que reconozcan los componentes de determinados tipos de elementos. Por ejemplo, los investigadores pueden enseñar a un algoritmo a reconocer una taza entrenándolo con imágenes de varios tipos de asas y llantas. De esa manera puede reconocer múltiples tipos de copas, no sólo las copas que tienen un conjunto particular de características.
Cualquier modelo de IA es tan bueno como los datos utilizados para entrenarlo. Muy pocos datos y los resultados que estos modelos de rastreo de enfermedades entregan pueden ser sesgados. Del mismo modo, la calidad de los datos es crítica. Puede ser particularmente difícil controlar la calidad de los datos no estructurados, incluyendo los datos de origen colectivo. Esto requiere que los investigadores filtren cuidadosamente los datos antes de alimentar sus modelos. Esta es quizás una razón por la que algunos investigadores, incluyendo los de BlueDot, deciden no utilizar los datos de los medios sociales.
Una forma de evaluar la calidad de los datos es verificando los resultados de los modelos de IA. Los investigadores necesitan comprobar el resultado de sus modelos contra lo que se desarrolla en el mundo real, un proceso llamado “ground truthing“. Las predicciones inexactas en la salud pública, especialmente con falsos positivos, pueden llevar a una histeria masiva sobre la propagación de una enfermedad.
La IA para el bien común
La IA es muy prometedora para identificar dónde y cuán rápido se están propagando las enfermedades. Cada vez más, los científicos de datos están usando estas técnicas para predecir la propagación de las enfermedades. Del mismo modo, los investigadores están usando estas técnicas para modelar cómo se mueve la gente dentro de las ciudades, potencialmente propagando los patógenos a medida que avanzan.
Sin embargo, la IA no elimina la necesidad de epidemiólogos y virólogos que están luchando contra la propagación en las primeras líneas. Por ejemplo, BlueDot utiliza epidemiólogos para confirmar los resultados de su algoritmo. La IA es una herramienta para proporcionar advertencias más avanzadas y más precisas que pueden permitir una rápida respuesta a un brote. La clave está en llevar la capacidad de previsión y predicción de la IA a los funcionarios de salud pública para mejorar su capacidad de respuesta a los brotes.
Incluso si todo lo demás fuera perfecto y la IA fuera una bala de plata tecnológica, el campo de la IA seguiría enfrentando desafíos éticos. Tenemos que estar más atentos a fenómenos como el de la línea roja digital, la versión computarizada de la práctica de negar recursos a las poblaciones marginadas, que puede arrastrarse hasta los resultados de la IA. Regiones o grupos demográficos enteros podrían quedar marginados, por ejemplo, del acceso a la atención de la salud si los datos utilizados para capacitar a un sistema de inteligencia artificial no los incluyeran.
En el caso de los modelos de inteligencia artificial que recopilan datos de medios sociales, la delimitación digital puede excluir a poblaciones enteras con un acceso limitado a la Internet. Es posible que esas poblaciones no estén publicando en los medios sociales o creando de otro modo las huellas digitales en las que se basan muchos modelos de inteligencia artificial. Esto podría llevar a los sistemas de inteligencia artificial a hacer recomendaciones erróneas sobre dónde se necesitan los recursos.
Aunque los investigadores están creando continuamente nuevos algoritmos de IA, algunas de las cuestiones fundamentales, como la comprensión de lo que ocurre dentro de los modelos, la reducción al mínimo de los falsos positivos y la identificación y la evitación de cuestiones éticas, no se comprenden bien y requieren más investigación.
La IA es una herramienta poderosa para predecir y pronosticar la propagación de enfermedades. Sin embargo, no es probable que reemplace completamente la probada combinación de estadísticas y epidemiología utilizada por primera vez cuando John Snow localizó y quitó el mango de la bomba de un suministro de agua con cólera en Londres en 1854.