de
KI-Produkt-Charts
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
Startseite
KI-Nachrichten
KI-Tagesbericht
Monetarisierungsanleitung
KI-Tutorials
KI-Tool-Navigation
KI-Produktbibliothek
de
KI-Produkt-Charts
Suchen Sie nach globalen KI-Produktdynamiken
Suchen Sie nach globalen KI-Informationen und entdecken Sie neue KI-Möglichkeiten
Nachrichten und Informationen
Produktanwendungen
Monetarisierungsfälle
KI-Tutorials
Typ :
Nachrichten und Informationen
Produktanwendungen
Monetarisierungsfälle
KI-Tutorials
2023-11-29 10:58:32
.
AIbase
.
3.7k
SALMONN-Framework: Erweiterung der allgemeinen auditiven Fähigkeiten großer Sprachmodelle
SALMONN ist ein audio-textuelles, multimodales Framework für große Sprachmodelle, das darauf abzielt, das Verständnis und die Verarbeitung allgemeiner auditiver Bereiche durch große Sprachmodelle zu erweitern. Das Framework integriert Komponenten wie den nicht-sprachlichen BEATs-Audio-Encoder, den Sprach-Encoder des OpenAI Whisper-Frameworks und den fensterbasierten Q-Former, um eine hohe zeitliche Auflösung für die Audio-Text-Ausrichtung zu erreichen. Nach einer Phase der Aktivierungseinstellung erreicht SALMONN eine wettbewerbsfähige Leistung bei Aufgaben wie Audio-Untertiteln und Sprachübersetzung und zeigt damit sein allgemeines auditives Potenzial.