lunes, enero 08, 2007

Wikipedia como fuente de inteligencia artificial


Es un tema que he comentado un montón de veces y que me parece fascinante: la posibilidad de utilizar la web como una fuente de asociaciones conceptuales con las que alimentar un sistema de inteligencia artificial. Hoy, vía Slashdot, llego a esta página de Physorg.com en la que se apunta como un grupo de científicos israelíes de están usando la Wikipedia precisamente para eso, para poder entender reglas de asociación de una manera más amplia. Usando el mismo ejemplo que en el original, un sistema anti-spam que utilizase esa metodología podría tener la palabra "vitamina" metida en su base de datos, pero desconocería, por ejemplo, el término "B12". A través de consultas en las páginas de la Wikipedia, podría fácilmente deducir una fuerte asociación entre las palabras "vitamina" y "B12", de manera que podría tomar la decisión de bloquear también los mensajes con esa palabra, actuando a modo de "repositorio de conocimiento" relativamente equivalente al que los seres humanos obtenemos mediante aprendizaje y experiencia. Tendría también un importante potencial semántico, al proporcionar una fuente para deducir contextos que permitirían, por ejemplo, separar los conceptos de "ratón" como periférico de ordenador o "ratón" como roedor. Lógicamente, el interés por utilizar la Wikipedia y no la web en general vendría del nivel de depuración adicional que ésta posee, que evitaría así cuestiones como la contaminación a partir de páginas web en las que algunas asociaciones se desarrollasen de manera errónea.

El mayor repositorio de conocimiento, la mayor enciclopedia creada por la mano del hombre, utilizada como fuente para el desarrollo de inteligencia artificial... tiene un punto verdaderamente metafísico, bonito, interesante, como si el alimentar esa "inteligencia al servicio de todos" hubiese sido siempre su verdadera función. Un cerebro powered by Wikipedia.

(Ilustración de Arnold Shimizu, "Artificial Intelligence", 1991)


via Enrique Dans Blog

1 comentario:

mperalta dijo...

Hola:

Es claro que Wikipedia tiene buenas capacidades de desambiguacion (si esa fuese una palabra valida).O sea, la capacidad de distinguir un termino en distintos contexttos. Pero de ahi a que se convierta en una ontologia en todo el sentido, me parece, por ahora, algo poco posible.

El experimento del que se habla tiene un alcance muy limitado. A mi entender, wikipedia tiene muy poca estructura para hacer de ella una ontologia formal. Esa falta de estructura me da mala espina en lo que se refiere a la construccion los indices que se requeririan a la hora de que otras aplicaciones deseen consultarla. Sin indices, los tiempos de respuesta serian muy altos.