Werner Vogels, le directeur technique d'Amazon, a récemment lancé un projet personnel appelé Distill CLI. Cet outil open source, qui utilise Amazon Transcribe et Amazon Bedrock, génère des résumés d'enregistrements directement depuis la ligne de commande. Écrit en Rust par Vogels, Distill CLI vise à automatiser la transcription et la synthèse de fichiers multimédias. Il utilise Amazon S3, AWS Lambda, Amazon Transcribe, Amazon Bedrock et AWS CDK pour gérer son infrastructure.
Exemple de sortie de Distlll CLI. Source : Blog All Things Distributed
Fonctionnalités et caractéristiques
Basé sur l'outil open source Amazon Bedrock Audio Summarizer, Distill CLI traite efficacement les enregistrements audio et génère des résumés. L'interface en ligne de commande permet aux utilisateurs de télécharger des fichiers multimédias et de suivre le processus de résumé, simplifiant ainsi la prise de notes et l'extraction d'informations. Vogels a mentionné ce projet pour la première fois dans son article « Hacking to make team meetings better », soulignant son utilité pour améliorer la prise de notes.
Avantages techniques
Vogels a partagé quelques choix techniques et résultats d'optimisation des premières phases du projet. Il a indiqué qu'en réécrivant les fonctions Lambda en Rust, la vitesse de démarrage à froid a été multipliée par 12 et l'utilisation de la mémoire a été réduite de 73 %. Cette optimisation rend le processus de résumé d'enregistrement plus efficace et réduit le nombre d'écritures sur S3. Les transcriptions et les résumés sont conservés en mémoire, améliorant ainsi les performances globales.
L'interface utilisateur de Distill CLI est simple, fournissant des mises à jour d'état et informant les utilisateurs de toute défaillance. L'outil prend en charge la sortie de résumés sur le terminal, ainsi que la génération de documents Word, de fichiers texte, de fichiers Markdown et de messages Slack. Il peut traiter les fichiers audio dans toutes les langues prises en charge par Amazon Transcribe.
Première version de Distill. Source : Blog All Things Distributed
Contexte et objectifs du projet
Vogels a déclaré qu'il cherchait constamment à améliorer ses méthodes de prise de notes. Bien qu'il préfère généralement le papier et le crayon, il reconnaît les avantages de la technologie pour améliorer la capacité de collecte d'informations, notamment lors de réunions nécessitant une participation active.
Vogels souligne que Distill CLI a été initialement développé pour répondre aux besoins de son équipe, mais aussi pour se mettre au défi en apprenant un nouveau langage. Ce projet démontre que la pratique est un moyen d'apprentissage efficace, tout en maintenant la curiosité technologique.
En intégrant les fonctions de transcription et de résumé d'enregistrements dans un outil simple et efficace, Distill CLI offre une solution puissante pour gérer et exploiter au mieux le contenu audio. Avec les optimisations et les améliorations futures, cet outil devrait jouer un rôle important dans la collaboration d'équipe et la prise de notes lors des réunions.
Adresse du projet : https://github.com/awslabs/distill-cli/