KI-Nachrichten

Verpassen Sie keinen Moment der globalen KI-Innovation

KI-Tagesübersicht

Tägliche Drei-Minuten-KI-Branchentrends

KI-Zeitleiste

Meilensteine der KI-Industrie

Al hardware

die artillerie der artillerie

KI-Monetarisierungs-Leitfaden

Neueste Fälle

KI-Monetarisierungsfall-Sharing

Bildersammlung

KI-Bilderstellungs-Monetarisierungsfälle

Videosammlung

KI-Videoerstellungs-Monetarisierungsfälle

Audiosammlung

KI-Audioerstellungs-Monetarisierungsfälle

Inhaltssammlung

KI-Content-Writing-Monetarisierungsfälle

KI-Tutorials

Neueste Tutorials

Kostenlose Weitergabe der neuesten KI-Tutorials

KI-Produkt-Rankings

KI-Produkt-Ranking

Zeigt das Ranking der Gesamtbesuche von KI-Websites

KI-Traffic-Wachstumsranking

Verfolgen Sie die am schnellsten wachsenden KI-Websites nach Traffic

KI-Traffic-Rückgangsranking

Konzentrieren Sie sich auf KI-Websites mit signifikanten Traffic-Einbrüchen

KI-Wochenranking

Zeigt das wöchentliche Besuchsranking von KI-Websites

Beliebte Länder-Rankings

Vereinigte Staaten

KI-Websites, die bei US-Nutzern am beliebtesten sind

China

KI-Websites, die bei chinesischen Nutzern am beliebtesten sind

Indien

KI-Websites, die bei indischen Nutzern am beliebtesten sind

Brasilien

KI-Websites, die bei brasilianischen Nutzern am beliebtesten sind

Beliebte Kategorie-Rankings

Bildgenerierung

Ranking der Gesamtbesuche von KI-Bildgenerierungs-Websites

Persönlicher Assistent

Ranking der Gesamtbesuche von KI-Websites für persönliche Assistenten

Charaktergenerierung

Ranking der Gesamtbesuche von KI-Websites zur Charaktergenerierung

Videogenerierung

Ranking der Gesamtbesuche von KI-Videogenerierungs-Websites

Beliebte Open-Source-Datenrankings

KI-Projektranking

GitHub beliebte KI-Projekte nach Gesamt-Stars

KI-Projektwachstumsranking

GitHub beliebte KI-Projekte nach Wachstumsrate

KI-Entwickler-Ranking

GitHub beliebtes KI-Entwickler-Ranking

KI-Organisationsranking

GitHub beliebtes KI-Organisationsranking

Beliebte Open-Source-Kategorien

Deepseek

GitHub beliebte Deepseek Open-Source-Projekte

TTS

GitHub beliebte TTS Open-Source-Projekte

LLM

GitHub beliebte LLM Open-Source-Projekte

ChatGPT

GitHub beliebte ChatGPT Open-Source-Projekte

KI-Open-Source-Projektbibliothek

Überblick

Überblick über GitHub beliebte KI-Open-Source-Projekte

Produktbibliothek Tool Navigation

Android Studio integriert Gemini mit neuen multimodalen Funktionen: Entwickler können Bilder hochladen und UI-Code erhalten

AIbase基地

Veröffentlicht amKI-Nachrichten und -Informationen · 4 Minuten Lesezeit · Mar 14, 2025

Google hat kürzlich bekannt gegeben, dass der Gemini-Assistent in Android Studio um die Unterstützung für Multimodal-Eingaben erweitert wurde. Entwickler können jetzt Bilder zu ihren Eingabeaufforderungen hinzufügen, um visuelle Unterstützung bei der Anwendungsentwicklung zu erhalten.

Diese Multimodal-Funktion wurde erstmals auf der I/O 2024 vorgestellt. Der verbesserte Gemini kann nun „einfache Wireframes verstehen und in verwendbaren Jetpack Compose-Code umwandeln“. In der Canary-Version von Android Studio Narwal wurde dem Ask Gemini-Feld die Option „Bilddatei anhängen“ (JPEG- oder PNG-Formate werden unterstützt) hinzugefügt. Google empfiehlt die Verwendung von Bildern mit „starkem Farbkontrast“ und „klaren Anweisungen“ für optimale Ergebnisse.

Entwickler können Screenshots und Benutzeroberflächen von einfachen Wireframes bis hin zu hochauflösenden Modellen hochladen und die gewünschten Funktionen angeben. Im Beispiel eines Taschenrechners kann beispielsweise verlangt werden: „Stellen Sie sicher, dass Interaktion und Berechnung wie erwartet funktionieren“.

Typische Eingabeaufforderungen zur Umwandlung von visuellem Design in funktionsfähigen UI-Code lauten beispielsweise: 1. „Schreibe auf Basis des bereitgestellten Bildes Android Jetpack Compose-Code, um einen Bildschirm zu erstellen, der diesem Bild so nahe wie möglich kommt. Stelle sicher, dass Importe enthalten sind, Material3 verwendet und der Code dokumentiert wird.“ 2. „Schreibe auf Basis des bereitgestellten Bildes Android Jetpack Compose-Code, um einen Bildschirm zu erstellen, der diesem Bild so nahe wie möglich kommt. Sei kreativ mit den Farben. Stelle sicher, dass Interaktion und Berechnung wie erwartet funktionieren. Stelle sicher, dass Importe enthalten sind, Material3 verwendet und der Code dokumentiert wird.“

Google positioniert Gemini als Tool zur Bereitstellung eines „initialen Design-Frameworks“. Der generierte Code muss in der Regel noch weiter bearbeitet und angepasst werden. Häufige Verbesserungen umfassen die Sicherstellung der korrekten Importe von Zeichnungen und Icons. Google empfiehlt, den generierten Code als effizienten Ausgangspunkt zu betrachten, um den UI-Entwicklungsprozess zu beschleunigen.

Darüber hinaus kann die visuelle Analysefunktion von Gemini zur Identifizierung und Lösung von Fehlern verwendet werden. Entwickler können „Screenshots einer fehlerhaften Benutzeroberfläche hochladen, und Gemini analysiert das Bild und schlägt mögliche Lösungen vor“. Entwickler können auch relevante Code-Schnipsel hinzufügen, um genauere Hilfe zu erhalten.

Android Studio's Gemini unterstützt auch das Hochladen von Architekturdiagrammen und das Abrufen von Erklärungen oder Dokumentationen, ähnlich der Gemini Astra-Brilleneigenschaft, die zuvor auf der I/O-Konferenz vorgestellt wurde.

GeminiAssistent AndroidStudio MultimodalInput JetpackCompose

Dieser Artikel stammt aus dem AIbase-Tagesbericht

Willkommen im Bereich [KI-Tagesbericht]! Hier ist Ihr Leitfaden, um jeden Tag die Welt der künstlichen Intelligenz zu erkunden. Jeden Tag präsentieren wir Ihnen die Hotspots im KI-Bereich, konzentrieren uns auf Entwickler und helfen Ihnen, technologische Trends zu erkennen und innovative KI-Produktanwendungen zu verstehen.

—— Erstellt von der AIbase-Tagesberichtgruppe