TAG-Bench é um benchmark para avaliar e pesquisar o desempenho de modelos de processamento de linguagem natural (PNL) na resposta a consultas de banco de dados. Construído com base no benchmark BIRD Text2SQL, ele aumenta a complexidade das consultas ao adicionar requisitos de raciocínio semântico que exigem conhecimento de mundo ou que vão além das informações explicitamente presentes no banco de dados. O TAG-Bench visa impulsionar a fusão entre IA e tecnologias de bancos de dados, oferecendo aos pesquisadores uma plataforma para desafiar modelos existentes, simulando cenários reais de consultas a bancos de dados.