【AI日報】へようこそ!ここでは、毎日人工知能の世界を探求するためのガイドとして、AI分野のホットな話題を毎日お届けします。開発者を重視し、技術トレンドの把握や革新的なAI製品の応用に関する理解を深めるお手伝いをします。

最新のAI製品はこちらからご覧ください:https://top.aibase.com/

1、何でも簡単にふわふわに!アリババ通義Appに「部分スタイル化」機能が登場

通義Appの最近追加された「部分スタイル化」機能が、ソーシャルメディアで話題になっています。簡単な操作で、写真に様々なスタイル効果を追加できます。通義万相ACE画像編集モデルのサポートにより、簡単な説明で画像編集が可能になり、利用ハードルが大幅に低くなりました。

image.png

【AiBase要約:】

🖼️ 通義Appの「部分スタイル化」機能を使えば、写真の中の特定のオブジェクトに簡単にスタイル効果を追加できます。

✨ 最初にリリースされたスタイルテンプレートには、ニット、ボア、氷彫刻、陶器など7種類があり、ユーザーの選択肢が広がります。

🤖 この機能は通義万相ACEモデルに基づいており、ユーザーは口語的な指示で様々な画像編集タスクを実行できます。

2、アリババ国際AIチームがオープンソースの開放型問題推論モデルMarco-o1を発表

アリババ国際AIチームが発表したMarco-o1モデルは、開放型問題の解決に特化しており、従来の標準的な解答の範囲を超えています。このモデルは革新的なself-playとMCTS技術を用いて、自己反省能力を持つ超長CoTデータを作成し、機械翻訳など他の分野でも高い能力を示しています。

image.png

【AiBase要約:】

🧠 Marco-o1モデルは開放型問題の解決に特化しており、従来の学問分野の枠を超えています。

🔍 このモデルはself-playとMCTS技術を用いて、自己反省と修正能力を持つ超長CoTデータを作成しています。

🌐 研究チームは、AI分野の更なる発展を促進するため、より多くのデータとモデルをオープンソース化する予定です。

詳細はこちら:https://modelscope.cn/models/AIDC-AI/Marco-o1

3、AnthropicがオープンソースのMCPプロトコルを発表 AIシステムとデータソースの双方向接続を促進

Anthropicが発表したモデルコンテキストプロトコル(MCP)は、AIアシスタントと様々なデータソースを接続することで、クエリ応答の質と関連性を向上させることを目的としています。MCPはAIアシスタントとデータソース間の分離の問題を解決し、開発者はアプリケーションとデータソース間の双方向接続を構築でき、システムの拡張性を簡素化します。

【AiBase要約:】

🌐 MCPプロトコルにより、AIアシスタントは複数のデータソースから直接情報を取得でき、情報サイロの問題を解決します。

🔄 開発者はMCPサーバーを使用してデータを共有し、異なるデータソースとの接続を簡素化できます。

📈 現在、多くの企業がMCPを統合しており、Anthropicは企業アプリケーションをサポートするために事前に構築されたMCPサーバーも提供しています。

詳細はこちら:https://www.anthropic.com/news/model-context-protocol

4、Runwayが画像生成モデルFramesを発表 特定の美学に焦点を当て、創造性の境界を再構築

RunwayのFramesモデルは、革新的な方法で視覚的創作の可能性を再定義します。Framesのユニークな点は、スタイルと美学に対する精密な制御であり、各フレームにアーティストのスタイルが反映され、同時に創造性の多様性を刺激します。

【AiBase要約:】

✨ Framesモデルはきめ細かい制御を提供し、ユーザーは画像の外観と雰囲気を正確に調整できます。

🌈 このツールはスタイルの一貫性を維持しながら、創造性の多様性を刺激し、様々な視覚プロジェクトに適しています。

🚀 Framesは単なる技術のアップグレードではなく、創造性の民主化の突破口であり、すべてのクリエイターに適しています。

詳細はこちら:https://runwayml.com/research/introducing-frames

5、発想の転換!Lumaが新しいDream Machineを発表 テキスト、画像、ビデオをワンストップで提供

Luma AIは、高品質な画像とビデオの作成プロセスを簡素化することを目的としたDream Machineプラットフォームを発表しました。あらゆる技術レベルのユーザーに適しています。このプラットフォームは高度なPhoton画像基礎モデルに基づいており、ユーザーは自然言語または参照画像を使用して創作でき、複雑なプロンプトエンジニアリングは不要です。Dream Machineの直感的なデザインと強力な機能(キャラクター参照、カメラワークなど)は、ユーザーエクスペリエンスを向上させます。

【AiBase要約:】

🖼️ Dream MachineプラットフォームはLumaの最新のPhotonモデルに基づいており、高品質な画像生成をサポートしています。

💬 ユーザーは自然言語による説明または参照画像のアップロードにより、創作プロセスを簡素化できます。

🎥 このプラットフォームはアニメーションのストーリー作成機能を提供し、ビデオ内のキャラクターの一貫性を確保します。

詳細はこちら:https://lumalabs.ai/dream-machine

6、NVIDIA製!AIオーディオモデルFugatto:テキストとオーディオを入力して音楽や効果音を生成

FugattoはNVIDIAが発表した革新的なオーディオ生成モデルで、25億個のパラメータを持ち、テキストとオーディオ入力により音楽制作を柔軟にサポートすることを目的としています。このモデルは従来のオーディオ生成の限界を突破し、革新的なデータ生成方法と組み合わせ可能なオーディオ表現変換技術を採用することで、アーティストや開発者はリアルタイムでサウンドを生成および変更できます。

【AiBase要約:】

🎵 FugattoはNVIDIAが発表したオーディオAIモデルで、25億個のパラメータを持ち、テキストとオーディオの入力をサポートしています。

💻 革新的なデータ生成方法と組み合わせ可能なオーディオ表現変換技術を採用することで、ユーザーは柔軟にサウンドを生成および変更できます。

🌟 初期テストでは、Fugattoは様々な専門モデルよりもオーディオ合成と変換において優れた性能を示しています。

詳細はこちら:https://blogs.nvidia.com/blog/fugatto-gen-ai-sound-model/

7、新しいAI画像生成フレームワークOminiControl:素材の主題を生成画像に統合可能

OminiControlは、シンガポール国立大学研究チームが提案した画像生成フレームワークで、画像生成の柔軟性と効率性を向上させることを目的としています。パラメータ再利用メカニズムにより、このフレームワークはより少ない追加パラメータで画像条件を処理でき、生成能力を大幅に向上させます。また、20万枚以上の整合性のある画像を含むSubjects200Kというデータセットも提供しており、研究者にとって豊富なリソースとなります。

image.png

【AiBase要約:】

🌟 OminiControlはパラメータ再利用メカニズムにより、画像生成の制御能力を強化し、効率性を向上させます。

🎨 このフレームワークは、エッジ、深度マップなど、複数の画像条件タスクを同時に処理でき、様々な創作ニーズに対応できます。

📸 研究チームは20万枚以上の画像を含むSubjects200Kデータセットを発表し、更なる研究と探求を支援します。

詳細はこちら:https://huggingface.co/spaces/Yuanshi/OminiControl

8、サムスン、Galaxy AIにChatGPTを統合へ、Google Geminiへの挑戦状

金融アナリストのDan Nystedt氏によると、OpenAIはサムスン電子と提携交渉を進めており、ChatGPTをサムスンの最新のGalaxy AIシステムに統合する計画です。この提携は、サムスンAIシステムの言語理解と対話能力を向上させ、GoogleのGeminiへの挑戦となる可能性があります。

【AiBase要約:】

📱 サムスンとOpenAIは、言語理解能力を向上させるため、Galaxy AIにChatGPTを統合する交渉を進めています。

🌐 この提携は、GoogleのGeminiモデルに大きな影響を与え、市場における支配的地位を脅かす可能性があります。

🤝 これは初めての提携の噂ではなく、サムスンとOpenAIの協力の可能性はますます高まっています。

9、アップルが2024年度iPhoneアプリのノミネートを発表、AIアプリが再び冷遇

アップルは先日、2024年度「iPhoneアプリオブザイヤー」のノミネートを発表しましたが、モバイルアプリエコシステムにおける人工知能技術の影響を過小評価していることが示されました。ChatGPTなどのAIアプリは市場で優れたパフォーマンスを見せていますが、ノミネートでは認められませんでした。

【AiBase要約:】

📉 アップルの2024年度「iPhoneアプリオブザイヤー」ノミネートリストは、再びAIアプリの影響を無視しています。

🎨 ノミネートされたアプリは、AIによる自動化機能に依存するのではなく、人間の創造性を刺激することに重点を置いています。

🏆 一部のAIアプリがiPadとMacの年間ノミネートに登場していますが、全体的なノミネート数は少ないです。

10.Kimi数学版が登場、科学的な思考で生活を解き明かす

Kimi数学版が正式にリリースされました。ユーザーはウェブページを通じてk0-mathモデルとインタラクトし、数学の知識を深く理解できます。このバージョンはLaTeX入力と数式変換をサポートし、ユーザーエクスペリエンスを向上させます。将来的にはモバイル版もリリース予定で、チームは機能とインタラクティブ性の最適化に取り組み、ユーザーが数学学習を楽しむことができるように努めています。

【AiBase要約:】  

🌟 Kimi数学版はk0-mathモデルを通じて数学的なインタラクティブ体験を提供します。  

🎮 ユーザーはこのバージョンを使って問題を解き、科学的な思考で生活を解き明かすことができます。  

📚 LaTeX入力と数式画像変換をサポートし、ユーザー操作が容易になります。

11、インテルの調査によると、AI搭載PCを使うと週4時間の時短に

インテルが最近発表した調査レポートによると、AI搭載PCはユーザーの作業効率を大幅に向上させ、平均して週240分以上の作業時間を節約できることが明らかになりました。この調査は、AI搭載PCがタスク処理、プライバシー保護、適応学習において優れていることを強調しています。

【AiBase要約:】

⏳ AI搭載PCは、ユーザーの日常業務時間を週240分節約できます。

💰 テック企業は、2025年までにAIインフラに2000億ドル以上を投資すると予想されています。

⚠️ AIスタートアップは資金調達の課題に直面しており、イノベーションの速度が低下する可能性があります。