Qué son los Embeddings: cómo Google responde a la intención de búsqueda

Índice del artículo

¿Qué son los embeddings?

Un embedding es una forma de convertir texto (palabras, frases o documentos) en vectores de números. Esos números capturan significado y contexto: términos afines terminan cerca entre sí en un espacio matemático, y términos diferentes quedan lejos.

Piensa en cada palabra como un punto en un mapa de muchas dimensiones. La cercanía entre puntos refleja cercanía de significado.

Esta representación permite comparar textos de forma cuantitativa y alimenta sistemas modernos de búsqueda, recomendación y QA.

Si quieres una guía aplicada a SEO con ejemplos prácticos, aquí tienes: Vectorización de contenido SEO y cálculo de la relevancia semántica.

Fundamentos matemáticos

Cada unidad de información se representa como un vector en un espacio de decenas o cientos de dimensiones. Los vectores se aprenden analizando grandes corpus: el modelo ajusta los números para que palabras que aparecen en contextos parecidos queden próximas.

Ejemplo conceptual de un espacio de embeddings en 3D: grupos de palabras relacionadas aparecen cerca.

Los grupos se forman de manera natural: “gato”, “perro” y “mascota” se agrupan; “coche” queda en otra zona. Esa geometría es útil porque podemos medir similitud con operaciones simples.

Cómo se calcula la similitud entre palabras o textos

Las dos medidas más usadas son:

Similitud del coseno: mide el ángulo entre dos vectores. 1 = misma dirección; 0 = sin relación; valores negativos indican direcciones opuestas (poco habituales en lenguaje natural).
Producto punto (dot product): multiplica componente a componente y suma. Considera tanto la dirección como la “longitud” de los vectores. Si no se normalizan, la magnitud influye en el resultado.

En la práctica, muchos sistemas de recuperación usan búsqueda por máximo producto interno (MIPS) por eficiencia: es muy rápida y aprovecha hardware e índices vectoriales optimizados.

Los embeddings también preservan la relación entre términos, no solo el significado

Los modelos pueden capturar patrones y relaciones además de similitudes. El ejemplo clásico es la analogía “rey – hombre + mujer ≈ reina” observada en modelos tipo Word2Vec. En modelos actuales basados en contexto (frases y documentos), las analogías son más sutiles y dependen del uso en oraciones, pero la idea central se mantiene: relaciones semánticas se reflejan en el espacio vectorial.

Embeddings en motores de búsqueda como Google

Los buscadores modernos representan tanto la consulta como los documentos con vectores y comparan esas representaciones para estimar relevancia. Esto permite entender sinónimos, reformulaciones y preguntas en lenguaje natural, y mejora la recuperación de pasajes específicos.

En Google, además de señales “clásicas” (enlaces, texto de la página, comportamiento agregado de usuarios), existen señales basadas en modelos profundos. Entre ellas destacan DeepRank (nombre interno de BERT aplicado a Search) y RankEmbed/RankEmbedBERT, descritas en materiales del juicio antimonopolio como señales de alto nivel para medir relevancia semántica. Para respuestas generativas, Google usa un sistema de recuperación acelerada llamado FastSearch, derivado de señales de RankEmbed, que prioriza rapidez para “aterrizar” (grounding) los modelos con menos documentos.

De las keywords al análisis semántico

El enfoque dejó de ser “¿aparecen las mismas palabras?” para pasar a “¿hablan de lo mismo?” Esto reduce la dependencia de coincidencias exactas (“móvil” vs “celular”) y mejora consultas conversacionales y ambiguas (“jaguar” animal o coche) usando el contexto de la frase.

¿Cómo lo hace Google exactamente?

Resumido en tres pasos, combinando IR tradicional con modelos profundos:

Paso 1 – Crear los vectores

Codificación dual: la consulta y cada documento se convierten en vectores (a veces varios por documento o por pasaje).
Expansión/entidades: el sistema puede expandir la consulta y detectar entidades para captar la intención.
Señales compuestas: los vectores se combinan con otras señales (texto, enlaces, calidad) en etapas posteriores.

Paso 2 – Comparar vectores

Para la búsqueda inicial (recuperación candidata) Google utiliza producto punto entre embeddings. Este criterio es muy eficiente con índices MIPS y funciona bien para consultas frecuentes. En 2025 Google presentó MUVERA, un método que resume representaciones multivector en un solo vector conservando la similitud mediante producto interno, lo que permite aplicar MIPS también en escenarios multivector y acelerar la recuperación de pasajes.

Ejemplo
Consulta: “cómo reparar mi celular”
Página: “guía para arreglar tu móvil paso a paso”
Sinónimos distintos, misma intención. Sus vectores apuntan en direcciones parecidas; el producto punto es alto y la página entra en el top de candidatas aunque no coincidan las palabras exactas.

¿Por qué eligieron el dot product?

Rendimiento: permite usar Maximum Inner Product Search, muy optimizado en hardware e índices vectoriales.
Sencillez: es equivalente al coseno si normalizas, y si no normalizas, la magnitud actúa como un peso aprendido por el modelo.
Escala: facilita comparar la consulta con millones de documentos en milisegundos, clave antes de etapas de reordenación más costosas.

Paso 3 – Elegir los mejores resultados

Con la primera tanda de candidatos, se aplican capas de reordenación. Aquí entran señales compuestas (por ejemplo, topicality a partir de texto y anclas, calidad de página, señales agregadas de interacción) y modelos más pesados tipo BERT/DeepRank o multivector. El objetivo es pasar de “parece relevante” a “es la mejor respuesta posible” para esa intención.

Para respuestas generativas, Google usa FastSearch (derivado de RankEmbed) para recuperar menos documentos con más rapidez y “aterrizar” los modelos. No es el mismo ranking que el de los resultados web completos.

De la densidad de keywords a la relevancia vectorial: la nueva palanca de crecimiento orgánico

El posicionamiento ya no va de repetir términos, sino de alinear el significado de tu contenido con la intención de búsqueda. Ideas prácticas:

Arquitectura por temas y entidades
Organiza el sitio por tópicos relacionados (clústeres) y enlaza internamente con anclajes descriptivos. Facilita que el buscador “vea” un bloque coherente y especializado.
Contenido completo y verificable
Cubre tareas, variantes y dudas reales. Refuerza con datos, ejemplos y referencias. La profundidad y la claridad mejoran tus señales de calidad y aumentan la probabilidad de recuperar el pasaje adecuado.
Mide con vectores
Usa embeddings (OpenAI, Cohere, Vertex AI, modelos abiertos como BGE/E5) y un índice vectorial (FAISS/ScaNN, pgvector, Pinecone, Weaviate, Qdrant) para:
- Detectar canibalizaciones semánticas (páginas que compiten por lo mismo).
- Descubrir huecos de contenido respecto a las consultas de tu público.
- Auditar si nuevos textos acercan tus vectores a las consultas objetivo y si eso se traduce en clics, leads o ventas.

Conclusión: piensa en vectores, no en densidades. Crea contenido que responda mejor que nadie a una intención concreta y comprueba con datos si te estás acercando a las consultas que importan.