Un mundo nuevo, parte 1: ¿Qué es la web semántica?
Sueño con una red en la que los ordenadores tengan la capacidad de analizar todos los datos disponibles en internet
- Tim Berners-Lee, creador del sistema World Wide Web, 1999.
A principios de 2017, WooRank, publicó una lista de tendencias del marketing de búsqueda según los expertos en SEO en las que fijarse durante este año. Detectarás un tema común en todas ellas: búsqueda conversacional, intención de búsqueda, procesamiento de lenguaje natural e inteligencia artificial (también llamada aprendizaje de máquinas o automático). Básicamente, lo que estamos diciendo es que los robots se están volviendo muy inteligentes y, en el caso de Google, están empezando a ser muy buenos a la hora de deducir el contexto.
El resultado de estos avances es lo que denominamos «web semántica».
Internet del pasado
Antes de que el marcado semántico entrase en escena, internet no era más que un conjunto de archivos distintos conectados a través de enlaces. Estos enlaces conectaban los archivos entre sí, permitiendo crear referencias sencillas y navegar a través de ellos. Los archivos eran normalmente páginas web, pero también podían ser documentos PDF, imágenes JPEG, videos u otros tipos de archivo. Esta era la estructura básica de internet.
Los motores de búsqueda trabajaban utilizando estos enlaces para navegar de sitio en sitio y de página en página, rastreando estas páginas y almacenándolas es sus bases de datos, denominadas «índices». Al rastrear e indexar páginas, los motores de búsqueda leían su código para averiguar qué partes eran imágenes, subencabezados o videos, cuál era el título y cuál era el cuerpo de la página. Esta información también se almacenaba en el índice y se utilizaba para determinar la relevancia respecto a las solicitudes de búsqueda de los usuarios.
Por supuesto, la relevancia no era el único factor determinante a la hora de mostrar un resultado de búsqueda, así que los motores de búsqueda también observaban los enlaces que apuntaban hacia el sitio web y utilizaban sus diversos elementos (hipertexto y dominio donde se hallaba el enlace, entre otros) para calcular la autoridad y la popularidad de cada sitio. El dominio donde se hallaba el enlace y el hipertexto actuaba como pistas sobre las palabras en las que los sitios y las páginas eran una autoridad.
Así llegamos a la idea de las palabras clave, que, junto con los backlinks, probablemente conozcas bastante bien. Los motores de búsqueda se basaban en las frases o palabras clave que coincidían con el código y el contenido de las palabras en la solicitud de búsqueda. A continuación, los motores de búsqueda determinaban su relevancia respecto a la solicitud basándose en la frecuencia de aparición de estas palabras clave en la página. Después, utilizaban los enlaces que apuntaban hacia la página para medir su precisión y autoridad. Esta es una explicación muy simple de cómo funcionaba, pero es suficiente para poder explicar cómo cambió todo.
La popularización de la web semántica
El sistema antiguo funcionaba muy bien, pero fallaba cuando la gente buscaba información más precisa, especialmente respuestas a preguntas. Si utilizamos el famoso ejemplo de Gary Illyes, imagina a alguien buscando una guía para superar un videojuego sin códigos para hacer trampas. Google veía «sin» como una palabra de detención, así que la ignoraba, de forma que la búsqueda «cómo superar un videojuego sin hacer trampas» se convertía en «cómo superar un videojuego hacer trampas», que era exactamente lo contrario a lo que la solicitud inicial pretendía encontrar.
Ahí es donde interviene la web semántica.
¿Qué es la web semántica?
Bien, ya que estamos hablando de semántica, empezaremos recordando algunas definiciones. En primer lugar, ¿qué significa «semántica»?
Disciplina que estudia principalmente el significado lingí¼ístico y también filosófico de las unidades del lenguaje, de los lenguajes de programación, de la lógica formal y de la semiótica. Se centra en la relación entre los significantes, como palabras, frases, signos y símbolos, y la denotación de cada uno de ellos.
O, dicho de forma más breve, Merriam-Webster indica que la semántica es el «estudio de los significados».
Por tanto, cuando dicho estudio de los significados se aplica al contenido web, obtenemos la web semántica:
La web semántica proporciona un marco común que permite compartir y reutilizar datos a través de aplicaciones, empresas y fronteras de comunicación
¿Qué significa eso?
Dicho de forma sencilla, la web semántica ofrece un modo de conectar ideas, también denominadas entidades, y partes de datos, no solamente archivos y páginas web. Estas conexiones permiten que los programas, como los motores de búsqueda, exploren más allá de las palabras en una página y accedan a las ideas y a los conceptos que esconden. Tomemos esta sencilla frase de ejemplo:
Nací en Michigan y soy residente en Bruselas.
Antes de la web semántica, no había forma de ayudar a los motores de búsqueda a conectar las palabras de esa frase con su significado: ¿quién soy yo (no es cuestión de ponernos cartesianos tampoco), qué es Michigan y qué es Bruselas?
Ahora, gracias a la web semántica, existe un método mejor de hacerlo: datos estructurados (también conocidos como marcado semántico), que ayuda a los robots a procesar esta frase con varios bits de HTML:
<div vocab="[http://schema.org/](http://schema.org/)" typof="Person"> <span property="name">Greg Snow-Wasserman</span> nació en <span property="birthPlace" typeof="Place" href="https://www.wikidata.org/wiki/Q1166"> <span property="name">Michigan</span> y es un residente de <span property="homeLocation" typeof="Place" href="https://www.wikidata.org/wiki/Q240"> <span property="name">Bruselas</span>
</span></div>
Ahora esa frase básica, que tanto humanos como máquinas podían leer, pero solo los humanos podían entender realmente, tiene significado para ambos.
En otras palabras, la web semántica cambia de una red de páginas enlazadas a una red de datos enlazados, representando los significados, ideas y conceptos que se hallan tras esos datos.
Recapitulemos, así es como la antigua red conectaba las ideas a través de páginas enlazadas:
En cambio, la web semántica ve las ideas como datos enlazados de este modo:
Cómo ha cambiado la búsqueda la web semántica
Como humanos, no vemos todo el marcado semántico que da significado a las palabras de la página, pero este ha tenido y sigue teniendo un gran impacto en los motores de búsqueda, ofreciendo lo que denominamos búsqueda semántica.
Hummingbird: Google como motor de respuestas
En septiembre de 2013, Google anunció que su equipo había estado aplicando una nueva actualización de su algoritmo durante un mes. Esa actualización, denominada Hummingbird (colibrí en inglés, porque se diseñó para ser «rápida y precisa»), otorgó a Google la capacidad de aplicar la web semántica a las solicitudes de búsqueda y a sus resultados.
Hummingbird analiza la semántica de las solicitudes de búsqueda para determinar la intención que se oculta tras ellas. Volviendo a nuestro ejemplo anterior, en «cómo superar un videojuego sin hacer trampas», Hummingbird ya no ve «sin» como una palabra de detención y puede deducir que el usuario en realidad está buscando una guía del juego u otras guías de estrategia y no cómo activar el modo dios.
A continuación, Hummingbird, gracias a su precisión, encuentra partes de contenido que satisfacen la intención de búsqueda y se las entrega al usuario. Fíjate en el uso de la palabra «contenido» en este caso: es un cambio realmente significativo respecto al antiguo sistema que solo entregaba la página que consideraba más relevante para las palabras clave de la solicitud. ¿Quieres verlo en acción? Echa un vistazo al posicionamiento de los resultados de la búsqueda «what is link juice» («qué es el link juice», en inglés).
Google ha sido capaz de interpretar el significado de la solicitud (encontrar la definición del término «link juice») y ha encontrado un párrafo en una página web que responde a la pregunta.
RankBrain es la esencia del motor de respuestas
Nuestro objetivo es crear un Google personalizado para todos y cada uno de los usuarios
- Sundar Pichai,CEO de Google
¿Cómo hace Google exactamente para deducir la intención de búsqueda y qué partes individuales de contenido satisfacen ese objetivo? Utiliza RankBrain, su sistema de aprendizaje automático e inteligencia artificial. Mucha gente (incluso nosotros, porque a veces resulta más sencillo) habla de RankBrain como si fuese un algoritmo, pero no es exactamente así.
Incluso aunque sabemos que es muy importante cuando se trata del posicionamiento en los resultados de búsqueda, el posicionamiento no es su función principal. Se trata más bien de un algoritmo de interpretación. Es la parte de Hummingbird que deduce qué significa «sin» en la solicitud anterior sobre videojuegos y la conecta con una página que proporciona una guía. También es la parte que lee la solicitud «qué tamaño tiene la tierra», y deduce que queremos saber cuál es la circunferencia del planeta Tierra.
Próximos pasos
Como puedes suponer, o probablemente ya hayas visto, la popularización de la web semántica puede causar un impacto importante en la optimización de los motores de búsqueda y en el marketing digital en general. El SEO se está volviendo mucho más complejo en algunos aspectos, mientras que en otros se está simplificando. Sin embargo, una cosa está clara: la web semántica ha llegado para quedarse, ¡así que sigue atento para no perderte la siguiente publicación de nuestra serie sobre la web semántica y aprender a recibir a los nuevos robots supremos que nos van a dominar!