AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

Android StudioにGeminiを統合し、マルチモーダル機能を追加 - 開発者は画像をアップロードしてUIコードを取得可能に

AIbase基地

公開日AIニュース · 1 分で読めます · Mar 14, 2025

Googleは最近、Android StudioのGeminiアシスタントがマルチモーダル入力に対応したと発表しました。開発者は、アプリケーション開発過程で視覚的な支援を得るために、プロンプトに画像を直接添付できるようになりました。

このマルチモーダル機能は、当初I/O 2024カンファレンスで発表されました。アップグレードされたGeminiは、「シンプルなワイヤーフレームを理解し、使用可能なJetpack Composeコードに変換する」ことができます。Android Studio NarwalのCanaryバージョンでは、「画像ファイルを追加」するオプション（JPEGまたはPNG形式をサポート）がAsk Geminiフィールドに追加されました。Googleは、最適な結果を得るために、「色のコントラストが強い」画像を使用し、「明確なプロンプト」を提供することを推奨しています。

開発者は、シンプルなワイヤーフレームから高忠実度のモデルまで、あらゆる種類のスクリーンショットやユーザーインターフェースをアップロードし、期待する機能を指定できます。たとえば、電卓のデザイン例では、「インタラクションと計算が期待通りに動作するように」要求できます。

視覚的なデザインを機能的なUIコードに変換するための代表的なプロンプトには、以下のようなものがあります。1.「提供されたこの画像に対して、この画像に可能な限り近い画面を作成するAndroid Jetpack Composeコードを作成してください。インポート、Material3の使用、コードの記述を含めてください。」2.「提供されたこの画像に対して、この画像に可能な限り近い画面を作成するAndroid Jetpack Composeコードを作成してください。色については自由に発想してください。インタラクションと計算が期待通りに動作するようにしてください。インポート、Material3の使用、コードの記述を含めてください。」

Googleは、Geminiを「初期のデザインフレームワーク」を提供するツールとして位置付けています。生成されたコードは、通常、さらに編集や調整が必要です。一般的な改善には、ドローアブルオブジェクトとアイコンの正しいインポートの確認が含まれます。Googleは、生成されたコードを効率的な出発点として扱い、UI開発ワークフローを加速させることを推奨しています。

さらに、Geminiの視覚分析機能は、エラーの特定と解決にも使用できます。開発者は「問題のあるUIのスクリーンショットをアップロードすると、Geminiはその画像を分析し、潜在的な解決策を提案します」。より正確な支援を得るために、関連するコードスニペットを添付することもできます。

Android StudioのGeminiは、アーキテクチャ図をアップロードして説明やドキュメントを取得することもサポートしており、これは以前I/Oカンファレンスで発表されたGemini Astraグラスの機能に似ています。

Geminiアシスタント AndroidStudio マルチモーダル入力 JetpackCompose

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

Google Geminiアシスタントのアップグレード：リアルタイムビデオ分析と画面共有に対応

Mar 4, 2025

100

百度文心一言、4月1日より全面無料化、深度検索機能も搭載

文心大模型の公式発表によると、2つの重要なアップデートにより、ユーザーにとってより便利で効率的な使用体験が提供されます。文心大模型の継続的なイテレーションとコスト最適化に伴い、文心一言は4月1日0時より全面的に無料化されます。PCとアプリの両方で、ユーザーは文心シリーズの最新モデルを無制限に体験できます。この措置は、文心一言のユーザーカバー率と市場影響力をさらに高めるものとなります。

Feb 13, 2025

5.6k

月額200ドル！OpenAI、ChatGPT Proを発表　o1完全版とPro版を体験可能

OpenAIは本日開催された「12日間12回のライブ配信」イベントの初日で、推論大規模言語モデルo1の完全版とその上級モード、そして月額200ドルのChatGPT Proサブスクリプションサービスを発表しました。o1大規模言語モデルの完全版は順次ChatGPT Plusユーザーに公開され、より人間らしい思考方法に近い内部思考チェーンを用いて質問に回答することで、専門的な質問への回答精度が向上します。9月に公開されたo1プレビュー版と比較して、完全版o1は…

Dec 6, 2024

3.6k

Google GeminiアシスタントがGmailに登場、AIによる有料ユーザー向けメール検索機能

Googleは木曜日に、AndroidデバイスのGmail有料ユーザー向けにAIアシスタント機能「Gmail Q&A」を導入したと発表しました。今後、iOSデバイスにも対応予定です。この機能により、ユーザーはGmailアプリ内でAIアシスタントGeminiと直接やり取りし、受信トレイの内容の閲覧、要約、特定情報の検索（特定メールの要点や過去のマーケティングキャンペーン費用など）を行うことができます。従来の検索バー横にGeminiボタンを追加することで、情報の検索効率が向上します。現時点では、この機能は電子メールに限定されています。

Aug 30, 2024

2.3k

ControlMM：テキスト、音声、音楽のマルチモーダル入力を用いた全身動作生成

ControlMMは、香港中文大学とテンセントが共同開発した革新的な技術フレームワークであり、マルチモーダル全身動作生成における課題解決を目指しています。このフレームワークは、テキスト、音声、音楽などのマルチモーダル入力をサポートし、コンテンツに合わせた全身動作を生成します。ControlMM-Attnモジュールを用いて動的および静的な人体トポロジーを並列処理することにより、効率的な運動知識学習を実現します。段階的なトレーニング戦略を採用し、テキストから運動プリトレーニング、マルチモーダル制御適応まで行うことで、さまざまな条件下でのモデルの有効性を確保します。ControlMM-Be

Aug 6, 2024

2.6k

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要