Imagínese que Google, en vez de darle una lista interminable de páginas más o menos relacionadas con el tema de su interés, le responda con un análisis sintético de todo lo que la web dice al respecto. Tal es el producto que IBM está poniendo en el mercado bajo el nombre de WebFountain, un hiper motor de búsqueda capaz de procesar toda la información disponible en la web para detectar movimientos de opinión y tendencias en actividades.

Almaden, San José, California, 22.sep.03

«WebFountain permite agarrar toda la información con valor comercial» nos declaró Bob Carlsson, vicepresidente de IBM a cargo del proyecto. «Además de la web, abarca grupos de discusión, publicaciones periódicas, bitácoras y ciertos mensajes electrónicos.» Pone a disposición de las empresas una forma de trabajar y recursos propios de los servicios de inteligencia.

IBM quiere ganar dinero con este considerable poder informático (2300 servidores InteLinux (con microprocesadores Intel y sistemas operativos Linux) cuya utilidad se debe a la creciente complejidad del proceso de toma de decisión de los ejecutivos de hoy. «Tienen que tomar entre 70 y 400 veces más decisiones que hace 15 años. Sin embargo, las informaciones a su alcance para tomarlas no son lo suficientemente granulares,» nos explicó Kevin Mann responsable de la estrategia y del mercadeo del proyecto.

Los servidores ya indexaron cuatro mil millones de páginas, «más que Google» dice Carlsson. «El tamaño de la web es de unas 16 mil millones de páginas. Crece de 50 millones más al día entre nuevas y actualizadas. Pensamos indexar lo restante en un año y luego mantenernos al día.»

Luego hace falta extraer los posibles sentidos que esos miles de millones de páginas tienen. WebFountain elimina primero todo lo porno («apenas es ruido para nosotros» dicen) se dedica entonces a un minucioso análisis de texto para marcar (tag) los nombres de empresas, las personas y sus títulos, los lugares, los temas y las fechas.

Con esto se puede empezar a «poner el contexto en el texto» según una expresión de Carlsson. «Un algoritmo analiza las relaciones entre esos datos» nos explicó Mann. «Podemos, hasta cierto punto, identificar el tipo de asociación entre dos informaciones o personas y su grado de separación. Las redes de asociaciones son útiles. Les pueden servir a los servicios de inteligencia, por ejemplo, cuando se trata de personas.» Pero reconoce que el grado de complejidad es muy elevado y que la tecnología se puede equivocar todavía. De ahí la necesidad de integrar la intervención humana de la cual Mann precisa: «Nuestra interacción con los datos contribuye al proceso creativo de WebFountain.»

IBM anunció el 18 de septiembre un contrato con Factiva, una sociedad de Reuters y el Wall Street Journal, para poner a disposición de grandes empresas la información proveniente de más de 8,000 fuentes. La primera aplicación ofrecida consiste en determinar, «lo que todo el mundo piensa de una empresa». British Petroleum se ha interesado en este servicio. IBM que ha recibido críticas por problemas de contaminación debidos a materiales utilizados en la fabricación de microprocesadores «también es un cliente» según Carlsson.

La tecnología puede ser utilizada para la investigación científica (principalmente por empresas farmacéuticas) y también para el análisis de un sector de mercado «en el cual se quiera identificar las oportunidades y las amenazas por parte de competidores potenciales» explica Mann. Finalmente, WebFountain puede ser utilizado con fines de seguridad e inteligencia, privadas o de gobiernos.

De hecho WebFountain parece ser bastante cercana a las tecnologías que el Pentágono está tratando de implementar en el marco del Terrorism Information Awareness Office (TIA), una de las oficinas encargadas de reunir y procesar informaciones relacionadas con la lucha anti-terrorista. Vale notar que el TIA despertó airadas relaciones (incluso en el Congreso) por las amenazas que hace pesar sobre la privacidad de los ciudadanos.

WebFountain

Artículo sobre TIA

J’enquête, je suis et j’analyse les technologies de l’information et de la communication depuis la préhistoire (1994). Piqué par la curiosité et l’envie de comprendre ce que je sentais important,...