Hugging Face präsentiert aMUSEd-Modell: Bilderzeugung in Sekundenschnelle

站长之家

Veröffentlicht amKI-Nachrichten und -Informationen · 1 Minuten Lesezeit · Jan 5, 2024

225

Das von Hugging Face entwickelte aMUSEd-Modell kann innerhalb weniger Sekunden Bilder generieren. Es basiert auf einem leichtgewichtigen Text-zu-Bild-Modell und nutzt die Masked Image Model (MIM)-Architektur. Dies reduziert die Inferenzschritte erheblich und verbessert sowohl die Generierungsgeschwindigkeit als auch die Interpretierbarkeit. Das aMUSEd-Modell kann in einer Demo auf Hugging Face ausprobiert werden. Es wird derzeit als Forschungs-Preview mit der OpenRAIL-Lizenz angeboten und die Community wird zur weiteren Erforschung von nicht-diffusionsbasierten Frameworks für die Bilderzeugung ermutigt.

360 bietet DeepSeek kostenlose Sicherheitsdienste an – Nano-KI-Suche eröffnet „DeepSeek-Hochgeschwindigkeitsverbindung“

Das einheimische große Sprachmodell DeepSeek hat sich kürzlich im globalen KI-Bereich einen Namen gemacht und seine technischen Fähigkeiten beeindruckt. Gleichzeitig wurde es jedoch auch mit Bedrohungen durch externe Cyberangriffe konfrontiert. Vor diesem Hintergrund gab Zhou Hongyi, Gründer der 360 Gruppe, bekannt, dass 360 DeepSeek kostenlosen und umfassenden Schutz im Bereich der Cybersicherheit bieten wird, um die Entwicklung einheimischer KI-Technologien tatkräftig zu unterstützen.

Llama in 3 Tagen zu Mamba geschrumpft! Inferenzgeschwindigkeit um das 1,5-fache gesteigert

Die Forschungsergebnisse des Mamba-Teams konzentrieren sich darauf, das große Transformer-Modell Llama zu Mamba zu „destillieren“, indem ein neuartiger Inferenz-Decodierungsalgorithmus entwickelt wird, der die Inferenzgeschwindigkeit deutlich verbessert. Das Forschungsziel besteht darin, das umfangreiche Wissen von Llama zu nutzen und gleichzeitig die hohen Kosten für das Training großer Modelle von Grund auf zu senken. Das Forschungsteam kombinierte progressive Destillation, überwachtes Feintuning und gerichtete Präferenzoptimierung, um Zephyr-7B und Llama-38B erfolgreich in lineare RNNs umzuwandeln.

5-mal schnellere Ausführung großer Sprachmodelle auf Smartphones! Microsoft Asia Research veröffentlicht neue Technologie – Hochgeschwindigkeits-Erlebnis auch auf CPUs

Die T-MAC-Technologie (Table-Lookup-based MAC) zielt darauf ab, die Probleme mit Speicher und Rechenleistung bei der Bereitstellung großer Sprachmodelle (LLMs) auf Edge-Geräten zu lösen. Durch die Quantisierung der Modellgewichte zu Low-Bit-Darstellungen ersetzt T-MAC herkömmliche Multiplikationsoperationen durch Lookup-Tabellen (LUT) und erhöht so die Effizienz auf CPUs deutlich. Diese Methode reduziert den benötigten Speicherplatz erheblich, sodass LLMs mit Milliarden von Parametern effizient auf ressourcenbeschränkten Geräten ausgeführt und ein intelligentes Upgrade ermöglicht werden kann. Im Vergleich zu bestehenden Implementierungen bietet T-

Kimi Open Platform startet geschlossene Beta für Context Caching

Die Kimi Open Platform hat kürzlich die bevorstehende geschlossene Beta-Phase für die mit Spannung erwartete Context Caching-Funktion angekündigt. Diese innovative Funktion unterstützt große Sprachmodelle für lange Texte und bietet Benutzern durch einen effizienten Kontext-Caching-Mechanismus ein bisher unerreichtes Erlebnis. Laut Kimi Open Platform ist Context Caching eine Spitzentechnologie, die durch das Cachen redundanter Token-Inhalte die Kosten für Benutzeranfragen bei gleichen Inhalten erheblich senkt. Das Funktionsprinzip besteht darin, bereits verarbeitete Texte intelligent zu erkennen und zu speichern.