Willkommen bei der Rubrik „AI-Tagesbericht“! Hier finden Sie täglich einen Überblick über die Welt der Künstlichen Intelligenz. Wir präsentieren Ihnen täglich aktuelle Themen aus dem KI-Bereich, mit Fokus auf Entwickler, um Ihnen zu helfen, Technologietrends zu erkennen und innovative KI-Produktanwendungen kennenzulernen.

Neue KI-Produkte hier entdecken: https://top.aibase.com/

1. Der angeblich stärkste KI-Programmierer „Genie“ erobert die Welt und schlägt Devin und GPT-4!

Genie ist ein beeindruckender KI-Programmierassistent, der Devin und GPT-4 geschlagen und sich zum weltweit stärksten KI-Programmierer gekürt hat. Im SWE-Bench-Test erreichte er einen beeindruckenden Score von 30,08 %. Durch spezielle Datensätze und einen Selbstverbesserungsmechanismus überzeugt er besonders bei komplexen Codieraufgaben. Eine Testversion ist bereits verfügbar, und zukünftig werden weitere spannende Funktionen folgen.

【AiBase Zusammenfassung:】

🌟 Genie erreicht im SWE-Bench-Test 30,08 % und wird zum weltweit stärksten KI-Programmierer.

🚀 Spezielle Datensätze und ein Selbstverbesserungsmechanismus ermöglichen Genie herausragende Leistungen bei komplexen Codieraufgaben.

📝 Eine Testversion ist bereits verfügbar, weitere Funktionen folgen!

Mehr Infos: https://cosine.sh/blog/state-of-the-art

2. SD-Vermarktungstool ComfyUI_Bxb: ComfyUI-Workflows im Handumdrehen zu Miniprogrammen

SD-Vermarktungstool ist ein ComfyUI-Plugin, das Entwicklern neue Möglichkeiten zur Monetarisierung bietet. Mit der One-Click-Konvertierungsfunktion lassen sich Workflows mühelos in WeChat-Miniprogramme, Douyin-Miniprogramme und andere Formate umwandeln. Integrierte Zahlungsfunktionen ermöglichen den gesamten Prozess von der Idee bis zur Vermarktung. Zusätzliche Vorteile sind die Unterstützung verschiedener Medienformate, hohe Sicherheit und plattformübergreifende Kompatibilität. Zu beachten ist jedoch die mögliche zunehmende Homogenisierung von Inhalten durch die technologische Entwicklung.

image.png

【AiBase Zusammenfassung:】

🌟 One-Click-Konvertierung in verschiedene Formate, darunter WeChat-Miniprogramme, Douyin-Miniprogramme und H5-Seiten.

🌟 Integrierte Zahlungsfunktionen unterstützen Entwickler bei der Monetarisierung ihrer Inhalte und steigern ihre Einnahmen.

🌟 Unterstützung verschiedener Medienformate, inklusive der Erstellung von Bildern im Batch und der Verarbeitung von Videoeingaben und -ausgaben, ermöglicht vielfältige Inhalte.

Mehr Infos: https://top.aibase.com/tool/comfyui-bxb

3. Das leistungsstarke Modell MiniCPM-V2.6 von Mianbi erobert GitHub

MiniCPM-V2.6 ist ein Edge-Modell, das in der globalen Open-Source-Community schnell unter die Top 3 aufgestiegen ist. Mit seinen 8 Milliarden Parametern erzielt es deutliche Verbesserungen beim Verständnis von Einzelbildern, mehreren Bildern und Videos und übertrifft sogar GPT-4V. Seine Inferenzgeschwindigkeit am Edge beträgt beeindruckende 18 Tokens/s, und es unterstützt mehrere Sprachen, was in der globalen Tech-Szene für großes Aufsehen sorgt.

【AiBase Zusammenfassung:】

🌟 MiniCPM-V2.6 hat über 10.000 Sterne auf GitHub erhalten und ist zu einem wichtigen Maßstab für die Leistungsfähigkeit von Edge-Modellen geworden.

💡 MiniCPM-V2.6 bietet hochentwickelte Funktionen wie Echtzeit-Videoverständnis, Verständnis mehrerer Bilder und multi-Bild-ICL bei einem geringen Speicherbedarf von nur 6 GB.

🚀 MiniCPM-V2.6 unterstützt die Inferenz mit llama.cpp, ollama und vllm und ist 33 % schneller als sein Vorgängermodell.

Mehr Infos: https://github.com/OpenBMB/MiniCPM-V

4. Baidu-Suche „KI-intelligente Antworten“ führt die AI-Produktliste im Juli in China an

Die Funktion „KI-intelligente Antworten“ der Baidu-Suche hat dank der Unterstützung des Wenxin-Großmodells die Spitze der nationalen Rangliste erobert und das traditionelle Sucherlebnis grundlegend verändert. Sie bietet intelligentere, effizientere und umfassendere Suchergebnisse und löst reale Benutzerprobleme. Baidu-Suche bietet außerdem weitere KI-Funktionen, darunter multimodale KI-Suchfunktionen, KI-Bildassistenten, KI-Grußkarten und KI-kreative Kurztexte, wodurch KI-Technologie in den Alltag integriert und die Sucheffizienz gesteigert wird.

【AiBase Zusammenfassung:】

🔍 Die Funktion „KI-intelligente Antworten“ mit Unterstützung des Wenxin-Großmodells führt die nationale Rangliste an und verändert das traditionelle Sucherlebnis.

🤖 Die Baidu-Suche bietet zahlreiche KI-Funktionen, darunter multimodale KI-Suchfunktionen, KI-Bildassistenten, KI-Grußkarten und KI-kreative Kurztexte.

💡 KI-Technologie macht die Suche intelligenter und effizienter, integriert sich in den Alltag und steigert die Sucheffizienz.

5. AI-gestütztes automatisches Videobearbeitungstool Clapper: Bilder, Videos und Sprache direkt online mit einem Klick erstellen

Clapper ist ein leistungsstarkes webbasiertes KI-Generierungs- und Videobearbeitungstool, das von einem einzelnen Entwickler erstellt wurde und das Potenzial individueller Kreativität unter Beweis stellt. Es integriert modernste KI-Technologien, vereinfacht den Videoerstellungsprozess und bietet eine einzigartige Benutzererfahrung, die kreative Freiheit ermöglicht. Clappers Open-Source-Philosophie und demokratischer Ansatz bringen frischen Wind in die Content-Creation-Branche, erinnern aber auch daran, dass Kreativität im Kern auf individueller schöpferischer Leistung beruht.

image.png

【AiBase Zusammenfassung:】

🚀 Clapper integriert verschiedene KI-Typen, darunter Bildgenerierung, Videogenerierung und Sprache, und vereinfacht den Videoerstellungsprozess.

💡 Clapper bietet eine Timeline-Funktion und zwei Modi, um die Bedürfnisse verschiedener Erstellungsphasen zu erfüllen, und eine einzigartige Benutzererfahrung.

🎬 Das Clapper-Team entwickelt derzeit einen „Director-Modus“, um Nutzern ein immersives Videobearbeitungserlebnis mit mehr Spaß und Erfolgserlebnissen zu bieten.

Website: https://top.aibase.com/tool/clapper

Projektseite: https://github.com/jbilcke-hf/clapper

6. Stufe-zehn Einsamkeit? Replika-CEO: Viele Nutzer entscheiden sich für eine „Ehe“ mit einem KI-Chatbot

In einem kürzlichen Interview erklärte der CEO von Replika, dass viele Nutzer bereit sind, ihren KI-Chatbot zu „heiraten“, da sie glauben, dass KI-Chat-Partner ihnen helfen können, Einsamkeit zu überwinden. Dies kann jedoch auch zu einer stärkeren Isolation von der Realität führen. Das Unternehmen konzentriert sich nun weniger auf romantische Beziehungen und bietet stattdessen Funktionen zur emotionalen Unterstützung an.

image.png

【AiBase Zusammenfassung:】

🌐 Nutzer heiraten gerne KI-Chatbots, solange es sie glücklicher macht.

💔 KI-Chat-Partner können Menschen helfen, Einsamkeit zu überwinden, können aber auch die Isolation von der Realität verstärken.

🔍 Das Unternehmen konzentriert sich weniger auf romantische Beziehungen und bietet stattdessen Funktionen zur emotionalen Unterstützung an.

7. Tencent veröffentlicht die Open-Source-Software für die automatisierte Fahrsimulation TAD Sim, basierend auf der Tencent-Spiel-Engine

Das Unternehmen Tencent hat kürzlich die automatisierte Fahrsimulations-Software TAD Sim veröffentlicht. Basierend auf einer professionellen Spiel-Engine und Digital-Twin-Technologie ermöglicht sie eine Closed-Loop-Simulationsverifizierung, unterstützt alle Phasen der Fahrzeugverifizierung, bietet eine hochgenaue Szenenwiedergabe und umfassende Sensormodelle und unterstützt so Simulationstests mit Millionen von Kilometern pro Tag. Die Plattform unterstützt das OpenX-International-Standardformat, ist für automatisierte Fahrsimulationstests und -bewertungen konzipiert und kann die gesamte automatisierte Fahr-Cloud-Toolchain integrieren. Zukünftig soll sie auf Simulationstests für intelligente vernetzte Fahrzeuge und virtuelle Testfahrten erweitert werden.

image.png

【AiBase Zusammenfassung:】

🚗 Hochgenaue Szenenwiedergabe, hochpräzise Fahrzeug-Dynamikmodelle

🛠️ Umfangreiche hochpräzise Sensormodelle, datengetriebene KI-Verkehrsflussmodelle

🔗 Unterstützt das OpenX-International-Standardformat und integriert die gesamte automatisierte Fahr-Cloud-Toolchain

Mehr Infos: https://github.com/Tencent/TAD_Sim

8. Microsofts Gesichtserkennungstechnologie Face Check ist jetzt verfügbar

Microsoft hat die Gesichtserkennungstechnologie Face Check offiziell vorgestellt, um Unternehmen sicherere und zuverlässigere Identifizierungsdienste zu bieten und effektiv gegen Cyberkriminalität vorzugehen. Die Technologie kombiniert ein Selfie mit einem verifizierten Ausweisfoto und verbessert so die Identifizierung von Unternehmen, während gleichzeitig die Privatsphäre der Nutzer geschützt wird.

image.png

【AiBase Zusammenfassung:】

🔒 Steigerung der Sicherheit der Unternehmensidentifizierung: Face Check-Technologie behebt effektiv die Schwachstellen traditioneller Identifizierungssysteme und wehrt Angriffe von Kriminellen ab.

📱 Effektive Bekämpfung von Betrugsversuchen: Face Check-Technologie wehrt verschiedene Betrugsversuche, einschließlich Deepfakes, ab und schützt die Identität der Nutzer umfassend.

💰 Flexible Gebühren: Unternehmen können Face Check einzeln erwerben (0,25 USD pro Verifizierung) oder die Entra Suite mit 8 kostenlosen Face Check-Verifizierungen pro Monat kostenlos testen.

9. Mercedes-Benz und Volcano Engine gehen eine strategische Partnerschaft im Bereich Großmodelle und generative KI ein

Mercedes-Benz (China) und Beijing Volcano Engine Technology haben eine strategische Kooperationsvereinbarung unterzeichnet, um die digitale Innovation in China zu beschleunigen, das Erlebnis im intelligenten Cockpit zu verbessern und Kunden ein personalisiertes digitales Luxus-Erlebnis zu bieten. Mercedes-Benz erhöht seine Forschungs- und Entwicklungsinvestitionen in China und integriert die Technologie von Volcano Engine in die Innovationen des intelligenten Cockpits, um ein neues intelligentes Cockpitsystem zu entwickeln. Zukünftig ist die Einführung der selbstentwickelten Architektur MB.OS geplant, die eine Entkopplung von Hard- und Software und kontinuierliches Lernen ermöglicht.

【AiBase Zusammenfassung:】

🚗 Mercedes-Benz und Volcano Engine unterzeichnen eine strategische Kooperationsvereinbarung zur Beschleunigung der digitalen Innovation in China.

🔍 Die Zusammenarbeit zielt darauf ab, das Erlebnis im intelligenten Cockpit zu verbessern und chinesischen Kunden ein personalisiertes digitales Luxus-Erlebnis zu bieten.

🌐 Mercedes-Benz plant die Einführung der selbstentwickelten Architektur MB.OS, die eine Entkopplung von Hard- und Software und kontinuierliches Lernen ermöglicht.

10. AMD übernimmt das führende europäische private KI-Labor Silo AI für 665 Millionen US-Dollar

AMD gab den Abschluss der Übernahme von Silo AI für einen Wert von rund 665 Millionen US-Dollar bekannt. Diese Übernahme stärkt AMDs Position im Bereich der Künstlichen Intelligenz und erweitert die Zusammenarbeit im globalen KI-Ökosystem.

【AiBase Zusammenfassung:】

AMD schließt die Übernahme von Silo AI für rund 665 Millionen US-Dollar ab und stärkt damit seine Position im Bereich der Künstlichen Intelligenz.

Silo AI wird in die KI-Sparte von AMD integriert und bringt ein Team von weltweit führenden KI-Wissenschaftlern und -Ingenieuren sowie hochmoderne KI-Modelle und -Lösungen mit.

AMD betont, dass die Übernahme von Silo AI darauf abzielt, Open-Standard-basierte End-to-End-KI-Lösungen anzubieten und eine gute Zusammenarbeit mit dem globalen KI-Ökosystem aufzubauen.

11. KI erobert die Wissenschaft! Sakana AI veröffentlicht den „KI-Wissenschaftler“

Die von Sakana AI vorgestellte „KI-Wissenschaftler“-Technologie könnte die Art und Weise, wie wissenschaftliche Forschung betrieben wird, revolutionieren und eine vollständig automatisierte wissenschaftliche Arbeit ermöglichen – von der Entwicklung neuer Ideen bis zum Verfassen wissenschaftlicher Arbeiten, alles wird von der KI erledigt. Das System ahmt die Arbeitsweise der menschlichen Wissenschaftswelt nach, generiert durch einen automatisierten Forschungslebenszyklus Artikel und führt Peer Reviews durch. Dies zeigt das Potenzial, die Forschung zu demokratisieren und den wissenschaftlichen Fortschritt zu beschleunigen.

image.png

【AiBase Zusammenfassung:】

🤖 Automatisierter Forschungslebenszyklus, von der Forschungsidee bis zum Verfassen von Artikeln.

🔬 Neue Beiträge in verschiedenen Teilbereichen des Machine Learning.

💰 Die Kosten für die Erstellung eines Artikels betragen ca. 15 US-Dollar, was das Potenzial zeigt, die Forschung zu demokratisieren.

Mehr Infos: https://arxiv.org/pdf/2408.06292