El Grupo de Nuevos Proyectos de Aispacs (Asociación para la Innovación Social y la Participación Ciudadana en Salud), del que formo parte, trabaja como una plataforma colaborativa centrada en la visualización de datos y el Análisis de Redes (AR). El Grupo ha abordado proyectos centrados en diversos temas, como el comercio mundial de vacunas, las plantillas profesionales de la sanidad pública, la política de compras de la Administración sanitaria o el mercado mundial del aceite de oliva. Uno de los proyectos actuales del Grupo consiste en visualizar y estudiar en clave de AR la información disponible en la COVID-19 Open Research Dataset (CORD-19), una gran base de datos de investigación abierta de acceso gratuito puesta a disposición de la comunidad internacional ante la emergencia del COVID-19.

La CORD-19 es una iniciativa impulsada por el Allen Institute for Artificial Intelligence de Seattle (EEUU) para compartir información de calidad generada por la comunidad científica abierta a todo el mundo, mediante la articulación del acceso a diversos repositorios en los que están contenidos más de 44.000 artículos en los que han participado como autores más de 15.000 científicos. La CORD-19 cuenta con el respaldo de diversas empresas, instituciones públicas y organizaciones privadas, entre ellas la Chan Zuckerberg Initiative, dedicada al impulso de proyectos globales de salud, puesta en marcha por el matrimonio integrado por la pediatra Linda Chan y el empresario Marck Zuckerberg.

Nuestra hipótesis de partida consiste en que una aproximación a la CORD-19 desde el ámbito de las ciencias sociales y el conocimiento de los flujos de información puede ayudar a identificar liderazgos reales dentro de la comunidad científica a día de hoy, un elemento que pensamos puede ser importante a la hora de ganar tiempo y coordinar esfuerzos en esta situación de emergencia global. Aplicar conceptos y herramientas de AR a la comunidad científica, entendida como una red de relaciones, puede ser útil. Si los científicos integran una comunidad, conceptos como el número de Dunbar o los mundos pequeños de Milgram deberían ser aplicables en alguna medida.

Nuestro objetivo con este proyecto es llamar la atención sobre la plausibilidad de este enfoque, más que una explotación exhaustiva de la información, dada la limitada capacidad de computación de nuestros equipos.

Nuestra fuente de información ha sido el archivo metadata de la CORD-19. Tras un trabajo previo de depuración de datos, nos centramos en un primer destilado de autores, el millar con actividad publicadora más intensa (quién tiene más artículos indexados en los repositorios). Este análisis preliminar únicamente ha tenido en consideración a los autores y a los lugares donde su trabajo está virtualmente accesible.

Tras filtrar decenas de miles de datos de la CORD-19, buscando a los científicos que más han publicado sobre los coronavirus en general y sobre el de la pandemia COVID-19 en particular, hemos identificado a 43 autores relevantes.

Nuestro interés no era saber quién publica más sino cómo se relacionan los científicos que publican más, a fin de identificar posibles contextos de colaboración.

Una de las pistas que ofrece esta aproximación a la CORD-19 es la identificación de esos ambientes virtuales, posibles contextos de encuentro; las contribuciones de esos 43 investigadores se encuentran recogidas en tres repositorios: la editorial Elsevier, el archivo de publicaciones PMC de la National Library of Medicine de EEUU y el repositorio de la Organización Mundial de la Salud (OMS).

La visualización de esas relaciones y su análisis AR (ver grafo que ilustra este post) revela la existencia de dos clusters de autores y destino de sus contribuciones (rojo y azul). El grosor de las aristas es proporcional a la intensidad de la actividad publicadora del autor. El mayor polo de atracción de autores es el de las publicaciones de PMC. El cluster articulado por Elsevier incluye por su parte en su zona de influencia al repositorio de la OMS, lo que podría indicar pasillos de comunicación rápida entre ambos contextos.

La gran mayoría de los autores con actividad publicadora más intensa en la comunidad científica centrada en los coronavirus son asiáticos, muy presumiblemente chinos y, en menor proporción, de Corea del Sur e India. Este dato puede estar expresando la existencia de una nueva realidad: Asia lidera la investigación en esta materia, en aspectos de ecología viral, biología molecular, biotecnología aplicada y manejo clínico de las enfermedades causadas por estos agentes infecciosos, a pesar de que el relato político y mediático dominante en Occidente todavía diga que la investigación puntera de éxito es patrimonio de Europa y EEUU. Este dato del liderazgo asiático, aun preliminar y no exhaustivo, es coherente con otros datos del entorno, como la misma eclosión de la pandemia en China, la respuesta del Gobierno y de sus ciudadanos, incluida su comunidad científica, a la situación de emergencia, y la reacción ejemplar de Corea del Sur para atajar la expansión del virus.

Asimismo, cabe hacer notar que buena parte, aún indeterminada en nuestro proyecto de estudio, de las publicaciones fechadas a partir de 2019 recogidas en CORD-19, se centran en aspectos relacionados con la experiencia de los profesionales sanitarios en el manejo de la patología COVID-19, subrayando la relevancia del aspecto clínico en el manejo de la pandemia, asunto que no ha sido a todas luces suficientemente subrayado en el relato dominante sobre la pandemia en países como España, donde se incide más en la expectativa de noticias futuras procedentes de la investigación básica, que, por definición, es mucho más lenta que la clínica.

Dentro de este grupo de 43 autores de referencia, se detecta un subgrupo de nueve investigadores que poseen mayor actividad publicadora y a la vez están mejor conectados en esta red, ocupando una posición de influencia relativa similar. Estos referentes de la comunidad son: Chaomin Wu (Universidad Fudan de Shanghai, China); Sumit Kumar (Universidad de Delhi, India); Chang-yun Chen (Tercera Universidad Médica Militar de Chongqing, China); Shi Zhao (Universidad de Hong Kong, China); Changtai Wang (Segundo Hospital de la Universidad Médica Anhui de Hefei, China); Long-Quan Li (Primera Escuela Médica de la Universidad de Lanzhou, China); Lei Zhang (Universidad Médica China Shenyang de Liaoning, China); Jeong-Min Kim (Centros de Control y Prevención de Enfermedades de Corea de Chengju, Corea del Sur); y Ling Lin (Academia China de Ciencias Médicas de Beijing, China).

La agencia EFE se ha hecho eco de este trabajo. El periódico La Vanguardia es el primero que recogió su teletipo.


Grafo: elaboración propia.