Google Geminiモデルの人物画像生成機能が再開

IT之家
この記事はAIbaseデイリーからのものです
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
【AIデイリー】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。
インターネット発展の歴史において、Googleの台頭はほぼ伝説的です。1999年の設立以来、Googleはシンプルで広告のない検索体験で多くのユーザーを獲得し、創設者のラリー・ペイジとセルゲイ・ブリンは初期において広告を強く避け、広告が検索の質に影響を与える可能性があると信じていました。しかし、2000年になると、Googleは収益化のためAdWordsを発表し、広告収入に依存する巨大企業へと急速に変貌を遂げ、広告は検索結果ページの重要な構成要素となりました。しかし
4月25日、アリババ傘下のクォークAIスーパーボックスは、革新的な機能「写真でクォークに質問」を発表しました。この新機能は、高度な画像認識と推論モデルに基づいており、物理世界でユーザーが遭遇するさまざまな問題をより正確に理解し、回答することができます。
AI業界の競争が激化する中、Ema社は新型言語モデルEmaFusionを発表しました。コストと精度において、O3、Gemini、Sonnetを含む複数の著名なAIモデルを上回ると主張しています。従来の単一戦略システムとは異なり、EmaFusionは「カスケード」判定システムを採用し、コストと精度を動的にバランスさせることができます。また、ユーザーは具体的なタスクのニーズに合わせて微調整することも可能です。Emaの最高経営責任者Sur…