La société informatique indienne Tech Mahindra a annoncé le lancement de "Project Indus", un modèle linguistique de base open source pour les langues indiennes. Ce projet pourrait bien être le plus important entrepris par la société à ce jour.
Le modèle prendra initialement en charge 40 dialectes de langues indiennes, avec une taille de paramètre prévue de 7 milliards. Tech Mahindra collecte des données via des canaux de dons linguistiques et collabore avec diverses parties prenantes.
L'objectif du modèle est de servir 25 % de la population indienne.