Meta recientemente lanzó un proyecto llamado NotebookLlama, que puede generar resúmenes tipo podcast, similar a NotebookLM de Google. Este proyecto utiliza el propio modelo Llama de Meta y puede generar resúmenes tipo podcast a partir de archivos de texto cargados.
Primero, NotebookLlama crea una transcripción a partir del archivo (por ejemplo, un PDF de un artículo de noticias o un artículo de blog). Luego, agrega "más dramatismo" e interrupciones, y luego introduce la transcripción en un modelo de texto a voz. Aunque el resultado no suena tan bien como NotebookLM, los investigadores de Meta dicen que la calidad se puede mejorar con modelos más potentes.
En la página de GitHub de NotebookLlama escriben: "El modelo de texto a voz limita la naturalidad de su sonido". "[Además] otra forma de crear podcasts es hacer que dos agentes discutan sobre temas de interés y escriban un esquema del podcast. Actualmente usamos un solo modelo para escribir el esquema del podcast."
Aunque NotebookLlama no es el primer intento de replicar la funcionalidad de podcast de NotebookLM, sigue siendo un proyecto digno de atención. Sin embargo, todos los podcasts generados por IA comparten un problema común: el problema de las alucinaciones, es decir, los podcasts generados por IA inevitablemente contendrán cierto contenido ficticio.