¿Es posible realizar predicciones sobre las actividades de los usuarios de Internet en base a enlaces? ¿Qué podemos aprender a partir de los patrones de navegación online? El proyecto europeo NADINE crea algoritmos y métodos de análisis de las actividades online para obtener un conocimiento mayor sobre las relaciones entre personas, países e incluso bienes comerciales.
Internet cuenta hoy en día con unos cincuenta mil millones de páginas enlazadas que componen un espacio virtual gigantesco. Las interacciones de los usuarios proporcionan datos que, una vez desglosados y analizados, pueden servir para comprender una amplia gama de actividades humanas, por ejemplo las culturales o las económicas.
Financiado por el 7º Programa Marco de la UE mediante el programa de Tecnologías futuras y emergentes, el proyecto NADINE («New tools and Algorithms for DIrected NEtwork analysis») contribuye al desarrollo de nuevos motores de búsqueda, situando a Europa a la vanguardia de este campo tan relevante.
«Nos proponemos elaborar un mapa de la red que muestre cómo están enlazadas las páginas y el uso que se hace de los enlaces para desplazarse por la red», comenta el coordinador del proyecto NADINE, Dima Shepelyansky, director de investigación en el Laboratorio de Física Teórica en el CNRS de Toulouse.
Entre otras herramientas, el equipo del proyecto se vale de algunas proporcionadas por Google para observar los enlaces entre páginas. De este modo, por ejemplo, se puede obtener, la probabilidad de que ciertas personas visiten páginas concretas, tomen determinadas decisiones, compren artículos o voten de determinada manera.
Un seguimiento más preciso de la interacción en Internet
Para desarrollar y comprobar su metodología, los investigadores del proyecto estudiaron entradas biográficas en Wikipedia para averiguar si podían así clasificar a las personas referidas en función de su influencia. Analizaron los veinticuatros idiomas principales y consideraron la cantidad de artículos que enlazan a cada biografía mediante el sistema PageRank de Google, que determina la relevancia de una página a partir de las páginas importantes que enlazan a ella.
Pero este enfoque planteó un problema interesante que hubo que resolver, ya que como personalidad más importante se señaló al científico Linneo. Al ser el diseñador del sistema de clasificación de los organismos, existen enlaces a su página en cada artículo de la Wikipedia en el que se hace referencia a plantas y animales, circunstancia que sesgaba los resultados.
Entonces se decidió introducir CheiRank, otra herramienta que señala la importancia de una página teniendo en cuenta la proporción de enlaces que parten de ella. La combinación de ambas herramientas permitió generar un sistema sólido de medición de la importancia. Adicionalmente, esta metodología permite detectar comunidades web auto-organizadas e híper-enlazadas.
La información en línea fluye de manera similar a los intercambios comerciales
Los enlaces «a» y «desde» una página pueden indicar como se realizan intercambios de información y por ello, el proyecto decidió aplicar sus hallazgos al análisis de flujos comerciales. Para ello, NADINE empleó la base de datos sobre comercio mundial de la Organización de las Naciones Unidas, donde se recopila información de los últimos cincuenta años. «Hemos desarrollado una forma nueva de analizar el intercambio comercial de 61 productos en todos los países de la ONU y determinar la sensibilidad de la balanza comercial a las variaciones de precios», explica Shepelyansky.
En NADINE participan físicos teóricos, matemáticos e informáticos de Francia, Países Bajos, Hungría e Italia. «La financiación trasnacional europea resultó indispensable para reunir un equipo de científicos con trasfondos tan variados», añade.
El proyecto ha estado activo durante tres años y finalizará en abril de 2015, habiendo recibido 1,22 millones de euros de financiación de la UE. Ahora que la metodología ha quedado establecida, los investigadores del consorcio de NADINE continuarán su colaboración con varios socios, como por ejemplo la Organización Mundial del Comercio.
(European Commission, CORDIS)