Es un enfoque de aprendizaje automático (generalmente auto-supervisado) que enseña a un modelo a distinguir entre ejemplos ""similares"" y ""diferentes"". El objetivo es aprender una representación (embedding) en la que los ejemplos similares estén cerca en el espacio vectorial y los diferentes estén lejos. Permite que los modelos rindan mejor en escenarios reales al aprender representaciones de datos muy robustas sin necesidad de grandes cantidades de datos etiquetados, reduciendo así las alucinaciones y mejorando la calidad.