【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツをご紹介し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用に関する情報を提供します。

最新のAI製品詳細はこちらhttps://top.aibase.com/

1、世界初の汎用インテリジェンス体Manusが話題沸騰、招待コードが5万円に高騰

世界初の汎用インテリジェンス体Manusが、テクノロジー業界で大きな注目を集めています。Manusは、独立した思考と複雑なタスクの実行能力を備え、完全な成果物を提供できる強力な汎用性を示しています。日常業務の処理だけでなく、詳細な市場調査やパーソナライズされた旅行計画など、さまざまなタスクにも対応できます。二次市場では、Manusの招待コードの価格は999元から5万元まで異なり、値引きに応じない出品者もいることから、製品の希少性がわかります。

image.png

【AiBase要約:】

🚀 Manusは、独立した思考と複雑なタスクの実行能力を備え、強力な汎用性と実行力を示しています。

📊 市場調査や旅行計画など、複数の分野におけるManusの事例は、その実用性と効率性を示しています。

🏆 ManusはGAIAベンチマークテストで新記録を樹立し、同類製品をはるかに凌駕する技術性能を示し、そのリーダーシップを証明しています。

詳細リンク:https://manus.im/

2、アリババが新しいオープンソース推論大規模言語モデルQwQ-32Bを発表、DeepSeek-R1に匹敵する性能と低メモリ消費を実現

アリババのQwenチームは、強化学習により複雑な問題解決タスクにおける性能を向上させたオープンソースの大規模言語モデルQwQ-32Bを発表しました。320億パラメーターと131072トークンの拡張コンテキスト長をベースに、数学やプログラミングなどのベンチマークテストで、より多くのパラメーターを持つモデルに匹敵する性能を示しながら、メモリ消費を抑えています。

image.png

【AiBase要約:】

🚀 QwQ-32Bは強化学習技術を採用し、複雑な問題解決能力を向上させています。

💡 数学、プログラミングなどのベンチマークテストで、より多くのパラメーターを持つモデルと同等の性能を示し、メモリ消費を抑えています。

🧠 拡張コンテキスト長とagentic capabilitiesを備え、今後、強化学習の可能性を探求していきます。

詳細リンク:https://qwenlm.github.io/blog/qwq-32b/

3、OpenAI、GPT-4.5をChatGPT Plusユーザー向けに段階的に展開すると発表

OpenAIは最近、最新の人工知能モデルGPT-4.5をChatGPT Plusユーザー向けに段階的に展開すると発表しました。このモデルは対話能力が大幅に向上していますが、複雑な推論においてはまだ不足があります。100万トークンあたり150ドルという高コストのため、広く普及するかどうか懸念されています。

image.png

【AiBase要約:】

💬 GPT-4.5はOpenAIが新たに発表した最大の人工知能モデルで、ChatGPT Plusユーザー向けに段階的に展開されます。

⚖️ GPT-4.5は対話能力が大幅に向上していますが、複雑な推論においてはまだ不足があります。

💰 GPT-4.5の使用コストは100万トークンあたり150ドルと高く、広く普及するかどうか懸念されています。

4、Doubaoが深層推論モードをリリース:AIの論理チェーンを視覚化、Q&A検索の新境地を開拓

バイトダンスは、AIアシスタントDoubaoに「深層思考」推論モードを追加しました。このモードは、視覚化された論理チェーンによって、ユーザーのAIへの信頼性と透明性を向上させます。この技術はDoubao 1.5モデルをベースに、深層推論モデルの技術的ブレークスルーを組み合わせることで、AIの知能化と人間性を高め、Q&A、検索、ライティング、読書分野における大きな可能性を示唆しています。

image.png

【AiBase要約:】

🔍 深層思考モードは、AIの完全な論理チェーンを表示することで、ユーザーのインタラクション体験を向上させています。

🤖 このモードはDoubao 1.5モデルをベースに、RLアルゴリズムとエンジニアリングの最適化を利用して、AIの知能性を高めています。

📈 新機能は、さまざまな分野におけるAIの大きな発展の可能性を示しており、ユーザー体験が大幅に向上しています。

5、LTX-Video 0.9.5リリース:商用ライセンスに対応、オープンソースAI動画生成が新たな高みに

LTX-Video 0.9.5のリリースは、オープンソースAI動画生成技術の大きな進歩を示しています。商用ライセンスに対応し、企業や個人開発者が商業プロジェクトでこのモデルを使用できるようになっただけでなく、キーフレーム条件サポートの導入により、動画生成の柔軟性と品質が向上しました。さらに、解像度と生成速度も大幅に向上し、複雑なナラティブのニーズにも対応できるようになりました。

image.png

【AiBase要約:】

🌟 最大の特徴は商用ライセンスに対応していることで、適用範囲が広がりました。

🎥 キーフレーム条件サポートの導入により、動画生成の柔軟性が向上しました。

📈 解像度と生成速度が大幅に向上し、複雑なナラティブのニーズに対応できます。

6、テキスト音声変換システムSpark-TTS:ゼロショット音声クローンと詳細な制御に対応

Spark-TTSは、ゼロショット音声クローンと詳細な音声制御機能を備えた高度なテキスト音声変換システムであり、AIコミュニティで大きな注目を集めています。Qwen2.5をベースに構築されており、音声生成プロセスを簡素化し、効率性を向上させ、多言語生成に対応しています。特にオーディオブック制作に適しています。その技術アーキテクチャはBiCodecシングルストリーム音声コーデックを採用し、音声品質の自然さと制御性を確保し、ユーザーは必要に応じて音声特性を調整できます。

image.png

【AiBase要約:】

🎤 ゼロショット音声クローン:特定のトレーニングデータなしで話者の声を生成でき、パーソナライズされたアプリケーションに適しています。

⚙️ 詳細な音声制御:ユーザーは、話速やピッチを正確に調整でき、さまざまなニーズに対応できます。

🌍 多言語生成:複数の言語に対応し、高い自然さと正確性を維持し、グローバルな適用性を拡大しています。

詳細リンク:https://github.com/SparkAudio/Spark-TTS

7、GoogleがWhisk Animateプレビュー版を発表:画像を8秒のアニメーション動画に変換

Googleは、実験的なAIプラットフォームGoogle LabsでWhisk Animateのプレビュー版を発表しました。ユーザーは、高度なVeo2モデルを使用して、静止画のWhisk画像を8秒のダイナミックなビデオクリップに変換できます。この新機能はソーシャルメディアで大きな話題となり、ユーザーからのフィードバックも好意的で、クリエイティブ業界における可能性を示しています。Whisk Animateの発表は、静的なデザインから動的なコンテンツへの変換がよりシンプルで効率的になったことを意味し、Googleの生成AI分野における競争優位性をさらに強化しています。

image.png

【AiBase要約:】

🎥 Whisk AnimateはVeo2モデルを使用して静止画を8秒のダイナミックなビデオに変換し、アニメーション生成の柔軟性を示しています。

🌟 ユーザーからのフィードバックは好意的で、初期のテストユーザーからは「非常に素晴らしい」との評価を得ており、創作における可能性を示しています。

🖼️ Whisk Animateの発表は、クリエイティブ業界に新しいツールを提供し、短編動画の作成や広告デザインのプロセスを簡素化しています。

8、Cohereが新しいマルチモーダルAIモデルAya Visionを発表、32Bと8Bの2つのバージョンを提供

Cohereの非営利研究ラボは、複数の言語と視覚タスクを実行できる最先端のマルチモーダルAIモデルAya Visionを発表しました。このモデルはWhatsAppを通じて無料で提供され、世界中の研究者による技術へのアクセスを促進することを目的としています。Aya Visionには32Bと8Bの2つのバージョンがあり、より大規模な競合モデルを上回る性能を示しています。さらに、Cohereは、現在のAI業界における評価の危機に対処するために、新しいベンチマーク評価ツールAyaVisionBenchも発表しました。

image.png

【AiBase要約:】

🌟 Aya VisionモデルはCohereによって業界最高と評価されており、複数の言語と視覚タスクを実行できます。

💡 Aya Visionには32Bと8Bの2つのバージョンがあり、より大規模な競合モデルを上回る性能を示しています。

🔍 Cohereは、AIモデルの評価問題を改善するために、新しいベンチマーク評価ツールAyaVisionBenchも発表しました。

詳細リンク:https://cohere.com/blog/aya-vision

9、TikTokがAIデータアノテーションサプライヤーの募集を発表

TikTokは3月6日、急速に成長するビジネスニーズに対応するため、高品質なAIデータアノテーションサプライヤーを募集すると発表しました。今回の募集は、医療、法律、教育など、豊富な垂直資源を持つ企業を対象としています。応募企業は独立した法人であり、登録資本金が100万元以上で、良好な社会的信用を有している必要があります。共同体での応募は受け付けていません。この戦略的な配置は、コンテンツの質とデータサービス能力の向上、業界の競争とイノベーションの促進を目的としています。

image.png

【AiBase要約:】

🌟 TikTokは登録資本金100万元以上のAIデータアノテーションサプライヤーを募集しています。

📄 応募企業は独立した法人であり、良好な社会的信用を有している必要があります。共同体での応募は受け付けていません。

🚀 募集は、TikTokのAIデータアノテーション分野における急速な成長ニーズに対応し、業界の発展を促進することを目的としています。

10、OpenAIが「博士レベル」AIエージェントを発表、月額料金は最大2万ドル

OpenAIは最近、「博士レベル」のAIエージェントを発表しました。これは、金融、医療、製造などの業界の高度なニーズに対応することを目的としています。このAIエージェントの月額料金は最大2万ドルで、さまざまなサービスを提供し、価格設定は製品が顧客に創造する経済的価値に基づいています。高額な料金には一部から皮肉も寄せられていますが、OpenAIは明らかに、個人ユーザーではなく大企業をターゲット顧客にしています。

image.png

【AiBase要約:】

💰 このAIエージェントの月額料金は2000ドルから2万ドルで、顧客に創造する経済的価値に基づいて価格設定されています。

🏢 OpenAIは、大企業をターゲット顧客としており、企業は従業員数に応じて料金を支払うことができ、利用のハードルを下げています。

✈️ AIエージェントは、最小限の人間の介入でタスクを自動的に実行することを目的としています。例えば、フライト情報を自動的に検索して支払いを行うなど。

11、Apple App StoreがAI生成アプリレビューサマリーを導入へ、ユーザーフィードバックの取得が容易に

Appleは、近日リリースされるiOS 18.4で、AI生成アプリレビューサマリー機能を導入すると発表しました。この機能は、ユーザーにアプリレビューの簡潔な要約を提供し、アプリのハイライトと重要な情報を迅速に把握できるようにすることを目的としています。サマリーは大規模言語モデルによって生成され、毎週更新されます。初期段階では、米国App Storeで展開されます。

image.png

【AiBase要約:】

🌟 AppleはiOS 18.4でAI生成アプリレビューサマリー機能を導入し、ユーザーがアプリのフィードバックを迅速に把握できるようにします。

🔄 これらのサマリーは毎週更新され、初期段階では米国App Storeで展開され、英語のレビュー数が十分なアプリを対象とします。

⚠️ この機能は、悪質な事業者によって悪用され、レビューの真実性と公正性に影響を与える可能性があります。

12、IBMが小型AIモデルGranite 3.2を発表、効率的な推論と実用性を強調