Es uno de los algoritmos más populares y eficientes para realizar búsquedas de vecinos cercanos aproximados (ANN). Construye una estructura de grafo jerárquico que permite navegar por el espacio de embeddings de manera muy rápida. Es una práctica frecuente en asistentes de IA y sistemas RAG que buscan una precisión muy alta con baja latencia. Permite combinar de forma segura los datos internos con el criterio del modelo, ya que asegura que la información recuperada sea la más relevante, mejorando la calidad de la respuesta final.