Gemini Embedding é um modelo de incorporação de texto experimental lançado pelo Google e fornecido por meio da API Gemini. O modelo apresentou desempenho excepcional em testes de benchmark de incorporação de texto multilíngue (MTEB), superando modelos de ponta anteriores. Ele pode converter texto em vetores numéricos de alta dimensão, capturando informações semânticas e contextuais, amplamente aplicadas em cenários de recuperação, classificação e detecção de similaridade. O Gemini Embedding suporta mais de 100 idiomas, possui comprimento de token de entrada de 8K e dimensão de saída de 3K, e introduziu a tecnologia de aprendizado de representação aninhada (MRL), permitindo o ajuste flexível de dimensões para atender às necessidades de armazenamento. O modelo está atualmente em fase experimental e uma versão estável será lançada no futuro.