Aunque puede parecer un poco ostentoso decirlo así, estamos ante la revolución de los datos. El mayor entendimiento acerca de cómo se procesan las enormes cantidades de datos generados no ya cada día, sino cada segundo en el planeta, nos ofrece beneficios en casi todas las áreas de interés, desde los negocios, pasando por la ciencia y la medicina e incluso en los videojuegos.
El llamado Big Data, un concepto más ligado al procesamiento de la información más que a la cantidad bruta de datos, supone nuevas formas de encontrar patrones en esos datos aparentemente inconexos, y en el caso de Microsoft, pueden detectar indicios de los síntomas del cáncer de páncreas al examinar largas secuencias de criterios de búsqueda.
La idea es sencilla, aunque es de explicación y aplicación compleja. Analizando las secuencias de búsqueda es posible extraer un patrón de búsquedas iniciales que terminen en un caso de cáncer de páncreas. Es decir, en otras palabras:
Los investigadores se centraron en las búsquedas realizadas en Bing, el motor de búsqueda de Microsoft, que indicaban que alguien había sido diagnosticado con cáncer de páncreas. A partir de ahí, trabajaron hacia atrás, en busca de las consultas anteriores que pudieran haber mostrado que el usuario Bing estaba experimentando síntomas antes del diagnóstico. Esas búsquedas tempranas, en su opinión, pueden ser señales de advertencia.
Cuando este modelo escala, es decir, cuando se comparan decenas y centenares de patrones que cumplen con lo anteriormente expuesto, se puede intentar predecir un diagnóstico con cierta probabilidad de éxito. El caso es que la probabilidad de éxito, de momento, es escasa: se pueden predecir con éxito entre el 5% y el 15% de los casos, con una proporción de falsos positivos de 1 entre 100.000.
Además, la información es anónima, por tanto las personas que realizan esas búsquedas y que son diagnosticadas, finalmente, no son notificadas. Queda mucho camino por recorrer para ello, y de momento ese 5%-15% de diagnóstico exitoso es demasiado escaso como para poder utilizarse la herramienta de forma generalizada. Y cualquier falso positivo es negativo para la persona, que primero piensa que está enferma, y luego resulta que no es así.
El Big Data es el futuro de la medicina, y por supuesto es el futuro del diagnóstico si se utiliza correctamente. Cuanto mayor es la muestra de datos, más fácilmente se pueden identificar patrones ocultos con anterioridad, y esos patrones nos pueden ser útiles para abrir nuevas vías de investigación, diagnóstico, e incluso curación.
Vía | NYTimes