L'université Stanford a de nouveau réalisé des progrès significatifs dans le domaine de l'intelligence artificielle. Son nouveau système STORM&Co-STORM, désormais open source, est capable de générer des articles longs et de haute qualité à partir d'une simple entrée de sujet, en intégrant des informations provenant de multiples sources. Cette innovation permet non seulement d'éviter les angles morts informationnels, mais aussi d'améliorer considérablement l'efficacité et la qualité de la rédaction scientifique.
La technologie de base de STORM&Co-STORM repose sur la recherche Bing et le support de GPT-4o mini. La partie STORM génère itérativement des plans, des paragraphes et des articles grâce à un dialogue multi-angulaire entre un « expert LLM » et un « animateur LLM ». Co-STORM, quant à lui, génère une carte mentale dynamique et interactive grâce à un dialogue multi-agents, garantissant ainsi que les besoins informationnels potentiellement négligés par l'utilisateur ne soient pas oubliés.
Il suffit à l'utilisateur de saisir un sujet en anglais pour que le système génère un long article de haute qualité intégrant des informations provenant de multiples sources, similaire à un article Wikipédia. Avec STORM, l'utilisateur peut choisir librement entre les modes STORM et Co-STORM. Une fois le sujet donné, STORM peut générer un long article structuré et de haute qualité en 3 minutes.
De plus, l'utilisateur peut cliquer sur « See BrainSTORMing Process » pour visualiser le processus de brainstorming des différents rôles LLM. Dans la section « Découverte », l'utilisateur peut consulter les articles et les exemples de discussions générés par d'autres chercheurs. Ses propres articles et historiques de discussions sont accessibles dans la barre latérale « Ma bibliothèque ».
Le processus d'écriture automatisé de STORM se divise en trois phases : génération de questions multi-perspectives, génération et amélioration du plan, et génération du texte complet. Le système consulte les articles Wikipédia pertinents pour identifier les différents points de vue sur le sujet, puis simule une conversation entre un rédacteur Wikipédia et un expert basé sur des sources en ligne fiables. Le plan est ensuite soigneusement élaboré à partir des informations recueillies sous différents angles grâce aux connaissances intrinsèques du LLM.
Bien que STORM identifie différents points de vue lors de la recherche sur un sujet donné, les informations recueillies peuvent néanmoins privilégier les sources principales d'Internet et contenir du contenu promotionnel. Une autre limite de la recherche est que, bien que les chercheurs se soient concentrés sur la génération d'articles de type Wikipédia à partir de zéro, ils n'ont considéré que la génération de texte librement organisé. Or, les articles Wikipédia de haute qualité rédigés par des humains contiennent généralement des données structurées et des informations multimodales.
Co-STORM vise à améliorer la collecte et l'intégration des informations afin de favoriser considérablement l'efficacité de l'apprentissage. Grâce à la collaboration multi-agents, aux cartes mentales dynamiques et au module de génération de rapports, il aide l'utilisateur à comprendre et à participer à l'organisation des informations. Les chercheurs ont mené une évaluation humaine auprès de 20 volontaires, comparant Co-STORM aux moteurs de recherche traditionnels et aux RAG Chatbot. Les résultats montrent que Co-STORM améliore considérablement la profondeur et l'étendue des informations ; 70 % des utilisateurs préfèrent Co-STORM, estimant qu'il réduit considérablement la charge cognitive.
Actuellement, STORM&Co-STORM ne prend en charge que l'interaction en anglais. Une extension à plusieurs langues est envisagée. La mise à disposition en open source de ce système marque une ère extraordinaire où les méthodes d'accès à l'information peuvent être entièrement personnalisées en fonction du niveau individuel, rendant l'apprentissage de n'importe quoi possible.
Adresse de l'article : https://www.arxiv.org/pdf/2408.15232