Willkommen bei der Rubrik „AI-Tagesbericht“! Hier finden Sie täglich Ihre Orientierungshilfe zur Erkundung der Welt der Künstlichen Intelligenz. Täglich präsentieren wir Ihnen die wichtigsten Themen aus dem Bereich KI, mit Fokus auf Entwickler, damit Sie Technologietrends erkennen und innovative KI-Produktanwendungen verstehen können.
Neue KI-Produkte Mehr erfahren: https://top.aibase.com/
🤖📱💼KI-Anwendungen
Peking Universität verbessert Open Sora Video-Generator! Länge bis zu 10 Sekunden, höhere Auflösung
【AiBase Zusammenfassung:】
⭐️ Veröffentlichung des Open-Sora-Plan v1.0.0-Modells: Deutliche Verbesserung der Video-Generierungsqualität und der Textkontrolle.
⭐️ Unterstützung des Huawei Ascend 910b-Chips verbessert die Laufzeit-Effizienz und -Qualität.
⭐️ Das Modell kann 10 Sekunden lange, 24 FPS Videos mit einer Auflösung von 1024×1024 erstellen und unterstützt auch die Generierung hochauflösender Bilder.
Projekt-Adresse: https://top.aibase.com/tool/open-sora-plan
Wenxin Yiyan App startet Funktion zur Erstellung individueller Stimmen
【AiBase Zusammenfassung:】
⭐ Wenxin Yiyan App – Auswahl der Erstellung eines intelligenten Agenten – Erstellung meiner Stimme, in 2 Sekunden eine individuelle Stimme erstellen.
⭐ Bei jedem Gespräch mit dem intelligenten Agenten kann die selbst erstellte Stimme für die Sprachansage verwendet werden.
⭐ Sie können auch die Anruftaste drücken, um in Echtzeit mit Ihrem selbst erstellten digitalen Avatar zu sprechen.
Produkt-Zugang: https://top.aibase.com/tool/wenxinyiyan
Midreal AI interaktives Roman-Spiel-Update der Webversion
【AiBase Zusammenfassung:】
⭐ Midreal AI interaktives Roman-Spiel bringt eine neue Webversion heraus, keine Bedienung über die Discord-Plattform mehr nötig.
⭐ Die Webversion von Midreal generiert für jeden Satz ein entsprechendes Bild und unterstützt die Erstellung von Video-Romanen.
⭐ Update auf SD-Modell, höhere Bildqualität, bessere Anweisungsbefolgung, stärkere Logik.
Produkt-Zugang: https://top.aibase.com/tool/midreal-ai
Kunlun Wanwei: TianGong SkyMusic KI-Musikgenerierungs-Großmodell wird am 17. April offiziell kostenlos freigeschaltet
【AiBase Zusammenfassung:】
⭐ Das von Kunlun Wanwei entwickelte KI-Musikgenerierungs-Großmodell „TianGong SkyMusic“ wird am 17. April offiziell kostenlos freigeschaltet.
⭐ Benutzer können mit dieser Anwendung ihre Inspiration in schöne Lieder verwandeln. Auch Anfänger können den Spaß am Musikmachen genießen.
⭐ Die Schritte zur Musikerstellung mit „TianGong SkyMusic“ umfassen das Herunterladen der Anwendung, das Schreiben von Texten, die Auswahl von Referenzliedern und das Teilen der Werke.
Testversion-Adresse: https://top.aibase.com/tool/tiangongskymusic
Kommt Sora in die Musikwelt? KI-Musik-Anwendung xgboost enthüllt, angeblich 10x besser als Suno!
【AiBase Zusammenfassung:】
⭐ Der Blogger @maxescu bewertet die KI-Musik-Anwendung xgboost, an deren Test er teilgenommen hat, sehr positiv und hält sie für bahnbrechend.
⭐ @maxescu gibt an, dass diese KI-Musik-Anwendung 10-mal besser als Suno ist, die Erwartungen sind auf dem Höhepunkt.
⭐ Die von dieser KI-Musik-Anwendung generierte Musik ist fast nicht von Spotify-Songs zu unterscheiden, was verblüffend ist.
NetEase AI Musik NetEase Tianyin startet Testphase, nur für Whitelist-Benutzer verfügbar
【AiBase Zusammenfassung:】
⭐ NetEase Tianyin ist ein neues KI-Musikwerkzeug, das Funktionen für die Arrangementerstellung, das Texten und die Songkomposition integriert.
⭐ In der Testphase ist die Nutzung nur für Whitelist-Benutzer möglich, um Feedback zur Produktverbesserung zu sammeln.
⭐ Das Werkzeug bietet umfassende Anleitungen und Schnellstart-Tutorials und unterstützt KI-Arrangements und die Funktion zum Erstellen von Songs mit einem Klick.
Produkt-Zugang: https://top.aibase.com/tool/wangyitianyin
Tara: Ein Plugin, das große Sprachmodelle in Comfy UI integrieren kann
【AiBase Zusammenfassung:】
⭐️ Große Sprachmodelle (LLMs) können in Comfy UI integriert werden.
⭐️ Durch einfache API-Einstellungen können Knoten zur Optimierung von Prompts usw. verwendet werden.
⭐️ Der TaraDaisyChainNode-Knoten realisiert komplexe Arbeitsabläufe und erleichtert die Bedienung und Optimierung.
Projekt-Adresse: https://top.aibase.com/tool/tara
Hand Talk: Automatische Übersetzung von Text und Audio in Gebärdensprache mithilfe von KI
【AiBase Zusammenfassung:】
🤖 Die Anwendung wird durch künstliche Intelligenz angetrieben und übersetzt automatisch Text und Audio in Gebärdensprache, um 4,66 Milliarden gehörlose und schwerhörige Menschen weltweit zu unterstützen.
🌐 Bietet automatische Gebärdensprachübersetzung und virtuelle Übersetzer Hugo und Maya, um das Lernen und den Austausch interaktiver zu gestalten.
📚 Neben der Übersetzung gibt es auch Lern- und Bildungswerkzeuge, die personalisierte und interaktive Funktionen unterstützen, um die Kommunikation einfacher und interessanter zu machen.
Website: https://top.aibase.com/tool/hand-talk
Download-Adresse: https://www.handtalk.me/en/app/
📰🤖📢KI-Neuigkeiten
ChatGPT wird den dynamischen Modus „Dynamic“ anbieten, der je nach Situation automatisch das für den Benutzer geeignete Modell auswählt
【AiBase Zusammenfassung:】
⭐ Das System wählt basierend auf Intelligenz, Fähigkeiten und Geschwindigkeit automatisch das am besten geeignete Modell für die Benutzeranforderung aus.
⭐ Das neue Tool „Tool use“ von Claude kann mehrere Modelle gleichzeitig aufrufen, um Probleme zu lösen, und zeichnet sich durch Flexibilität und Anpassungsfähigkeit aus.
⭐ Die „Dynamic“-Funktion von ChatGPT und die „Tool use“-Funktion von Claude repräsentieren den Fortschritt der KI-Technologie in Richtung Intelligenz und Automatisierung.
Entwickler, der die Inferenzfähigkeit von GPT-4 auf 0 schätzte, wird mit einem Preisgeld von 10.000 US-Dollar widerlegt
【AiBase Zusammenfassung:】
⭐️ Ein Entwickler war der Meinung, dass GPT-4 keine Inferenzfähigkeit besitzt und bot ein Preisgeld von 10.000 US-Dollar für eine Widerlegung an.
⭐️ Ein Nutzer erreichte mit einem leistungsstarken Prompt eine nahezu 100%ige Genauigkeit bei GPT-4.
⭐️ Claude-3Opus zeigt erstaunliche Rechenfähigkeiten und erreicht eine Erfolgsrate von 56%.
Detaillierte Informationen: https://www.chinaz.com/2024/0408/1608624.shtml
OpenAI plant den Aufbau eines „Datenmarktes“, um den Mangel an 20 Billionen Token für das Training von GPT-5 zu beheben
【AiBase Zusammenfassung:】
⭐️ Das unzureichende Datenangebot könnte die Entwicklung der künstlichen Intelligenz behindern.
⭐️ Unternehmen erforschen Methoden zum Trainieren mit synthetischen Daten, um den Mangel an Daten zu beheben.
⭐️ OpenAI plant den Aufbau eines „Datenmarktes“, um das Problem des Datenmangels zu lösen und die nächste Generation leistungsstarker Modelle zu trainieren.
Fireworks.ai veröffentlicht Open-Source-API, damit jeder Entwickler generative KI nutzen kann
【AiBase Zusammenfassung:】
⭐️ Die Open-Source-API von Fireworks hilft Entwicklern, schnell generative KI-Funktionen hinzuzufügen und die Kosten zu senken.
⭐️ Fireworks ermöglicht es Benutzern, mehrere Modelle auszuprobieren und sich schnell an Anwendungsfälle anzupassen.
⭐️ Der CEO arbeitete zuvor bei Meta und leitete ein KI-Plattformteam. Das Unternehmen erhielt eine Finanzierung von 25 Millionen US-Dollar.
Fireworks-Zugang: https://top.aibase.com/tool/fireworks-ai
Amazon Offline-Shop KI-Training fehlgeschlagen: Tausende von Prüfern für die manuelle Prüfung erforderlich
【AiBase Zusammenfassung:】
⭐ Amazon plante ursprünglich, die „Warenentnahme“-Technologie ohne Kassierer zu implementieren, aber das KI-Training schlug fehl.
⭐ Amazon wechselt zu einem Warenkorbmodell und bietet ein komfortableres Einkaufserlebnis.
⭐ Amazon unterstützt Verkäufer mit generativen KI-Funktionen bei Innovationen und vereinfacht die Erstellung von Angeboten.
Apple investiert 50 Millionen US-Dollar in die Lizenzierung von Millionen von Shutterstock-Bildern zum Trainieren von KI-Modellen
【AiBase Zusammenfassung:】
⭐ Apple hat eine Vereinbarung mit Shutterstock getroffen, um Millionen von Bildern für das Training von KI-Modellen zu lizenzieren.
⭐ Apple wird voraussichtlich 50 Millionen US-Dollar ausgeben, ähnlich wie bei Verträgen von Google, Meta und Amazon.
⭐ Apple plant, auf der WWDC-Konferenz die Integration weiterer KI-Technologien in das Betriebssystem anzukündigen.
SenseTime präsentiert FouriScale: Generierung hochauflösender Bilder ohne Training
【AiBase Zusammenfassung:】
⭐ Diffusionsmodelle übertreffen nach und nach GANs und autoregressive Modelle und werden zur wichtigsten Wahl für generative Modelle.
⭐ FouriScale realisiert die Bildgenerierung mit unterschiedlichen Auflösungen durch Atrous-Faltung und Tiefpassfilteroperationen.
⭐ Die Ergebnisse zeigen eine deutliche Verbesserung von FouriScale bei der Generierung hochauflösender Bilder.
Projekt-Adresse: https://top.aibase.com/tool/fouriscale
论文地址:https://arxiv.org/abs/2403.12963
————
Täglicher Midjourney Prompt: Blumen und schöne Frau