海外メディアAndroid Authorityの報道によると、GoogleはAIデジタルアシスタントGeminiに新機能を追加し続けています。深い文脈理解、ファイル処理の最適化、アプリ間の連携機能に続き、GoogleアプリのコードからGeminiがまもなく動画生成機能を搭載することが示唆されています。
また、「videogen」と以下の文字列を参照するコードファイルも見つかりました。
海外メディアAndroid Authorityの報道によると、GoogleはAIデジタルアシスタントGeminiに新機能を追加し続けています。深い文脈理解、ファイル処理の最適化、アプリ間の連携機能に続き、GoogleアプリのコードからGeminiがまもなく動画生成機能を搭載することが示唆されています。
また、「videogen」と以下の文字列を参照するコードファイルも見つかりました。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
最新の報道によると、グーグルのAIチャットボットGeminiの世界月間アクティブユーザー数は3.5億人に達しました。このデータは現在進行中のグーグルに対する独禁法訴訟の中で明らかになったもので、過去1年間でGeminiが著しいユーザー増加を遂げたことを示しています。注目すべきは、Geminiの日間アクティブユーザー数も大幅に増加しており、2023年10月の900万人から現在の3500万人へと、相当な伸びを見せていることです。Geminiのユーザー数は急速に増加していますが、
AI音声生成分野の競争が激化する中、韓国の2人の大学生が共同で開発したAI音声モデル「Dia」が登場し、GoogleのNotebookLMに匹敵する機能を謳っています。AI分野での経験は浅いものの、わずか3ヶ月でオープンアクセスな音声生成ツールを開発することに成功しました。Diaの学習にはGoogleのTPU Research Cloudプロジェクトが利用されており、研究者向けに…
アリババグループの科学者チームが、幅広い動画生成と編集タスクを統一的に処理することを目的とした汎用AIモデル、VACEを発表しました。VACEの中核は、強化された拡散Transformerアーキテクチャであり、その革新的な点は「ビデオ条件ユニット(VCU)」という新しい入力形式です。VCUは、テキストプロンプト、参照画像や動画シーケンス、空間マスクなど、多様なモダリティの入力を統一的な表現に凝縮し、専用のメカニズムによって異なる入力間の調整を行い、競合を回避します。概念の分離により、きめ細やかな制御を実現します。
最近の独占禁止訴訟で公開されたグーグルの内部文書によると、同社は昨年、サムスンなどの複数のAndroidスマートフォンメーカーと独占契約を締結することを検討していたことが明らかになった。これらの契約には、グーグルの検索アプリだけでなく、最近発表されたGemini AIアプリとChromeブラウザも含まれる。このニュースは、反トラスト規制が厳しくなる中で、業界に大きな注目を集めている。文書には、グーグルがこれらの提携を通じてAndroidデバイスにおける製品のシェア拡大を目指していたことが記されている。
最近のワシントンD.C.で行われたGoogleに対する反トラスト訴訟の公判で、OpenAIの幹部Nick Turley氏は注目すべき発言をしました。同氏は、裁判所が検索市場の競争回復のためにGoogleがChromeブラウザの売却を命じる判決を下した場合、OpenAIはChromeブラウザの買収を検討する意向があると述べました。この発言は、OpenAIが検索機能を重視していること、そして同社の将来的な野心を示すものです。Turley氏は、検索…