Willkommen bei der Rubrik „AI-Tagesbericht“! Hier finden Sie täglich Ihren Wegweiser durch die Welt der Künstlichen Intelligenz. Täglich präsentieren wir Ihnen die wichtigsten Themen aus dem Bereich KI, mit Fokus auf Entwickler, um Ihnen zu helfen, Technologietrends zu erkennen und innovative KI-Produktanwendungen kennenzulernen.

Neue KI-Produkte hier entdecken: https://top.aibase.com/

1、Stable Diffusion 3 API veröffentlicht – Leistung vergleichbar mit Midjourney v6

QQ截图20240418091243.png

【AiBase Zusammenfassung:】

🚀 Stability AI hat die API-Unterstützung für die neueste Stable Diffusion 3 und die Turbo-Version veröffentlicht.

🔍 Das SD3-Modell versteht und führt Benutzer-Textaufforderungen präziser aus, wodurch die generierten Bilder besser den Erwartungen der Benutzer entsprechen.

🤝 Laut offizieller Aussage erreicht oder übertrifft das SD3-Modell im Bereich der Text-zu-Bild-Generierung führende Modelle wie DALL-E 3 und Midjourney v6.

🚀 Stability AI arbeitet mit Fireworks AI zusammen, um einen schnellen und zuverlässigen API-Service bereitzustellen.

API-Dokumentation: https://top.aibase.com/tool/stable-diffusion-3-api

Testversion: https://sdxlturbo.ai/stable-diffusion3

2、Microsoft veröffentlicht die Lippensynchronisationssoftware VASA-1: Bilder und Sprache erzeugen realistische Sprechvideos

image.png

【AiBase Zusammenfassung:】

🌟 Kann Videos mit einer Länge von bis zu 1 Minute erstellen, mit synchronisiertem Mund und Erfassung subtiler Gesichtsausdrücke und Kopfbewegungen.

🌟 Unterstützt mehrere Sprachen, darunter Chinesisch, und kann auch singen.

🌟 Die Online-Generierungslatenz beträgt nur 170 Millisekunden und eignet sich daher für Live-Streams. Die Ergebnisse sind besser als bei EMO.

Projektseite: https://top.aibase.com/tool/vasa-1

Forschungsarbeit: https://arxiv.org/abs/2404.10667

3、AI-Umstyling MagicClothing: Ermöglicht kontrollierbare Umstyling-Effekte

image.png

【AiBase Zusammenfassung:】

👗 Kontrollierbare Kleidungsgestützte Bildsynthese: Benutzer können die Intensität von Kleidung und Textaufforderungen anpassen, um die synthetisierten Bilder zu steuern und eine personalisierte Bildsynthese zu erreichen.

🎨 Unterstützung verschiedener Modelle: Bietet Modellgewichte mit unterschiedlichen Auflösungen. Benutzer können das passende Modell für die Bildsynthese auswählen und qualitativ hochwertige Ergebnisse erzielen.

💃 Vielfältige Anwendungsszenarien: Geeignet für Mode-Design, Kunst, Einzelhandel und andere Bereiche, bietet innovative und bequeme, kontrollierbare, kleidungsgestützte Bildsynthese-Technologie.

Weitere Informationen: https://top.aibase.com/tool/magicclothing

4、Google veröffentlicht neues Code-Modell Code Gemma: Kleine Parameter, hohe Leistung, geringe Hardwareanforderungen!

image.png

【AiBase Zusammenfassung:】

⭐️ Code Gemma umfasst drei Versionen: Basis-Pretraining, Anweisungs-Feinabstimmung und schnelles Inferencing.

⭐️ Wurde mit über 500 Milliarden Tokens umfassend trainiert und kann schnell Code in gängigen Programmiersprachen generieren.

⭐️ Erreicht gute Ergebnisse auf mehreren bekannten Testplattformen, insbesondere bei Java, JavaScript und Kotlin.

Weitere Informationen: https://goo.gle/codegemma

5、Boston Dynamics präsentiert neuen elektrischen Atlas-Roboter

image.png

【AiBase Zusammenfassung:】

🔌 Elektrischer Antrieb: Der neue Atlas verwendet ein vollelektrisches System, das für einen reibungslosen und leisen Betrieb sorgt, die Energieeffizienz steigert und den Wartungsaufwand reduziert.

🤖 Bewegliche Aktionen: Hochleistungs-Elektroantriebe ermöglichen Atlas einen größeren und flexibleren Bewegungsspielraum, der dem menschlichen ähnelt und die Ausführung komplexer Aufgaben ermöglicht.

🔄 Modernes Design: Schlankes und leichtes Design, funktionaler runder Bildschirm am Kopf, verbessert die Funktionalität und das Mensch-Maschine-Interaktionserlebnis.

Weitere Informationen: https://bostondynamics.com/blog/electric-new-era-for-atlas/

6、InstantMesh: Schnelle Generierung hochwertiger 3D-Modelle

image.png

【AiBase Zusammenfassung:】

⚡ Schnelle Generierung: InstantMesh kann die Umwandlung von Bildern in 3D-Netze in etwa 10 Sekunden durchführen.

🌟 Hochwertige Ausgabe: Die generierten 3D-Modelle sind von hoher Qualität und erfüllen professionelle Anforderungen.

🔧 Feedforward-Framework: Verwendet ein Feedforward-Framework in Kombination mit fortschrittlichen Technologien zur Optimierung des 3D-Erstellungsprozesses.

Weitere Informationen: https://top.aibase.com/tool/instantmesh

7、Kimi intelligenter Assistent aktualisiert: Schnellere vernetzte Antworten, Suchfunktion mit Quellenangabe

image.png

【AiBase Zusammenfassung:】

🚀 Verbesserte Modellfähigkeiten, schnellere Antwortzeiten, verbesserte logische Schlussfolgerungsfähigkeit, verbesserte mathematische und Programmierfähigkeiten, verbesserte Genauigkeit bei Übersetzungen.

🔍 Neue Funktion für häufig verwendete Phrasen: Benutzer können mehr Szenario-Prompts hinzufügen, um die Arbeit zu erleichtern.

🎤 Unterstützt Sprach-Eingabe und -Ausgabe, bietet Sprachkommunikation und verschiedene Sprachauswahlmöglichkeiten.

8、ZeST: Übertragung von Texturen eines Bildes auf ein anderes Bild

image.png

【AiBase Zusammenfassung:】

⚙️ Unterstützt die Übertragung einzelner Texturen und die Bearbeitung mehrerer Texturen.

🔬 Extraktion impliziter Texturdarstellungen mithilfe von Diffusionsadaptern.

💡 Kombination von geometrischen und Beleuchtungsinformationen zur Texturübertragung.

Weitere Informationen: https://top.aibase.com/tool/zest

9、Rekordverdächtige Premiere des digitalen Liu Qiangdong

【AiBase Zusammenfassung:】

🚀 Über 20 Millionen Zuschauer bei der Premiere, Umsatz über 50 Millionen.

💡 Der KI-Digitalmensch „Käufer Dong Ge“ teilt seine Erfahrungen und erklärt den Inhalt des Livestream-Verkaufs.

💰 Über 100.000 Bestellungen im JD.com-Supermarkt, Einführung eines Subventionsprogramms für die Landwirtschaft im Wert von Milliarden.

10、EU-Aufsichtsbehörden genehmigen Microsofts 13 Milliarden US-Dollar-Investition in OpenAI

【AiBase Zusammenfassung:】

⭐️ Microsoft sucht aktiv nach Kooperationen mit anderen KI-Unternehmen, um globale Regulierungsrisiken zu vermeiden.

⭐️ Die weltweiten Bedenken hinsichtlich Investitionen in Hochtechnologie führen zu verschiedenen Untersuchungen, auf die Microsoft aktiv reagiert.

⭐️ Microsoft geht bei strategischen Investitionen vorsichtig vor und nimmt eine nicht-eigentümerische Position ein, indem es mit verschiedenen Partnern interagiert.

11、Bytedance „AI-Hausaufgabenhilfe“ Gauth belegt in den USA den zweiten Platz bei den Downloads von Bildungsanwendungen

image.png

【AiBase Zusammenfassung:】

🌟 Gauth belegt den zweiten Platz bei den Downloads von Bildungsanwendungen in den USA, nur hinter Duolingo.

🌟 Erfolgreicher Ausbau des Überseemarktes durch ein chinesisches EdTech-Unternehmen trotz politischer Risiken.

🌟 Gauth nutzt KI-Technologie, um Lösungen für verschiedene Fächer, Online-Expertenunterstützung usw. anzubieten, die von den Nutzern geschätzt werden.

Produktzugang: https://top.aibase.com/tool/gauth