Hace apenas dos semanas Google sorprendió con el lanzamiento de su proyecto Knowledge Graph, la nueva herramienta que pretende acercarse lo máximo posible al pensamiento humano, respondiendo a las consultas no sólo con enlaces, sino con conocimiento en forma de datos estructurados.
Para comprender mejor su funcionamiento, es conveniente analizar la situación actual de los buscadores, que se encuentran con tres problemas:
1.-Los motores de búsqueda habituales basan sus resultados en la frecuencia de aparición de uno o más términos en las páginas web y sus relaciones con otros sitios relevantes, analizándolos mediante complejos algoritmos.
2.-La heterogeneidad de formatos (HTML, PDF, fotografía, audio, vídeo, etc…) hace que sea difícil extraer palabras clave de muchos de ellos, y aún más relacionarlos entre sí.
3.-Los sistemas de información no trabajan “cómodos” con homonimias, polisemias, términos genéricos y específicos, sinónimos…y encuentran dificultades para entender palabras mal escritas o con faltas de ortografía. Resumiendo: Trabajan con significantes, no con significados.
Ante este panorama, Knowledge Graph supone un gran paso hacia la Web 3.0 ó Web Semántica, ya que permite realizar búsquedas en lenguaje natural, relacionar palabras, objetos y datos de diversas fuentes, resolver ambigüedades y presentar resultados estructurados que resuelven de forma más efectiva las peticiones de los usuarios.
Por el momento, esta nueva manera de presentar los resultados sólo está disponible en Estados Unidos, y relaciona más de 500 millones de entidades y 3.500 millones de datos, aunque se espera se vaya extendiendo en los próximos meses al resto de países.
El Gráfico del conocimiento muestra todo su potencial a la hora de buscar información pertinente y relevante sobre todo de personalidades, monumentos, lugares, etc.
Un claro ejemplo lo podemos encontrar si, desde Google.com, buscamos “Charles Aznavour”, polifacética personalidad de Francia.
Junto a los resultados habituales, un conjunto de enlaces ordenados conforme a su relevancia, encontramos en la parte derecha una recopilación de datos concretos y estructurados sobre Charles Aznavour, a saber: Breve biografía extraída de Wikipedia, álbumes, canciones, familia, películas en las que ha participado, así como búsquedas relacionadas, en función de las consultas de otros usuarios que también han buscado información sobre el cantante y cineasta francés.
Si buscamos “Sagrada Familia”, obtendremos unos resultados estructurados similares, brindando, sin necesidad de salir de Google, información como: Mapa de localización, estilo arquitectónico, arquitectos, medidas, búsquedas relacionadas, etc.
En nuestro país ya podemos ver algunos ejemplos de búsquedas de este tipo, aunque aún queda mucho por hacer. Sin ir más lejos, si a día de hoy buscamos “Torre Eiffel” en Google.es, ya encontramos información ordenada sobre su ubicación, horarios, parada del metro y opiniones de visitantes.
Pero lo que más sorprende es la capacidad para dar respuestas directas ante preguntas concretas en lenguaje coloquial. La herramienta aún está por depurar, pero por ejemplo, si en Google.com escribimos en el campo de búsqueda: “How old is Barack Obama”, el sistema devolverá, como primer resultado, y resaltado, su edad concreta: 50 years (August 4, 1961).
Esto es posible a que el buscador “extrae” estos datos de fuentes fiables, los contrasta, y los presenta de una forma comprensible por el ser humano, para que éste pueda resolver su necesidad informativa de forma rápida, fiable, y sin tener que acceder a otros enlaces, a no ser que quiera ampliar la información.
Por supuesto, estos avances beneficiarán a la comunidad de usuarios en cuanto a inmediatez, comodidad y simplificación, evitando en gran medida la conocida como “infoxicación” o “intoxicación informacional”. Por otra parte, como citan algunos autores, será necesario recordar que “la comodidad adormece la inteligencia”.
Mientras tanto, permaneceremos expectantes a los futuros cambios de la web, adaptándonos a ellos y conociendo las nuevas estrategias y técnicas necesarias para esta conversión de web 2.0 a semántica.
Todo apunta a que serán necesarias tareas de automatización que mapeen las estructuras de bases de datos y ontologías y extraigan los metadatos presentes en todos y cada uno de los objetos de la Web. En segundo lugar, las herramientas de creación de páginas y gestores de contenidos deben evolucionar para permitir el etiquetado semántico. Y por último, las diferentes comunidades deberán consensuar ontologías que relacionen el conocimiento.
Andrés Gonzalez
EXCELENTE PUBLICACIÓN! Estoy realizando mi tésis de la web semántica en Motores de búsqueda y este artículo me ha ayudado mucho a completar parte de mi contenido.. Cuando hablas de apenas hace 2 semanas google sorprendio con el lanzamiento del proyecto.. a que fecha exactamente te referis?
Raul
Hola Andrés! Muchas gracias por tu comentario, y de que este post te haya servido de gran ayuda. La fecha exacta es del 16 de mayo, aunque desde 2010, tras la adquisición de “Start-up Metaweb Technologies”, está trabajando en el proyecto.
Un saludo!