La empresa de tecnología india Tech Mahindra ha anunciado el lanzamiento de "Project Indus", un modelo lingüístico básico de código abierto para idiomas indios, que podría convertirse en su proyecto más importante hasta la fecha. Inicialmente, el modelo admitirá 40 dialectos de idiomas indios, con un tamaño de parámetros estimado en 7 mil millones.
Tech Mahindra está recopilando conjuntos de datos a través de donaciones lingüísticas y colaborando con diversas partes interesadas. El objetivo del modelo es prestar servicio al 25% de la población india.