AI日報：アリババが制御可能なSoraを発表；Google Gemini APIの大幅値下げ；Xiaomi 15シリーズがAIシステムに全面アップグレード；ReminiがAIアプリダウンロード数最多を達成

【AI日報】へようこそ！ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツをご紹介し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、Perplexityに匹敵！MindSearch：人間の思考を模倣したAI検索エンジン

MindSearchは、Perplexity.ai Proに匹敵すると言われる強力なオープンソースAI検索エンジンフレームワークです。大規模言語モデルを回答エンジンとして使用し、様々な問題を解決し、ウェブ上の知識を活用します。ユーザーインターフェースが最適化されており、オープンソースでマルチエージェントLLMフレームワークを備えています。深さ、広さ、正確性の点で優れたパフォーマンスを示し、期待される検索エンジンです。

【AiBase要約：】
🎯 MindSearchのパフォーマンスはPerplexity.ai Proに匹敵します。
🎯 日常生活の様々な問題を解決し、深く幅広い回答を提供します。
🎯 オープンソースでマルチエージェントLLMフレームワークを備え、ユーザーインターフェース体験が最適化されています。
詳細リンク:https://top.aibase.com/tool/mindsearch

2、軌跡制御可能！アリババが動画生成モデルToraを発表

アリババの研究チームが、軌跡ベースの新しい動画生成モデルToraを発表し、AI動画制作の新たな潮流をリードしています。Toraは、高忠実度、正確なモーションコントロール、多様な入力で知られており、高度なDiffusion Transformerアーキテクチャを採用することで、動画生成の限界を突破し、60秒の高品質動画生成を実現しました。独自の設計理念は、テキスト、ビジュアル、軌跡条件を融合し、動画コンテンツを正確に制御し、物理世界の運動法則をシミュレートすることで、映画の特殊効果制作や仮想現実分野に無限の可能性をもたらします。

【AiBase要約：】
🌟 高忠実度：Toraで生成された動画の品質はプロの制作に匹敵し、色、鮮明さ、滑らかさは一流です。
🎥 モーションコントロール：動画内の各動作を正確に制御し、高速な動きや微妙な変化を正確に表現します。
🔄 多様な入力：テキストの説明、静止画、動的な軌跡を処理し、様々な創造的なニーズを満たします。
詳細リンク:https://top.aibase.com/tool/tora

3、意外な展開！ReminiがChatGPTを抜き、ダウンロード数最多のAIアプリに

ReminiがChatGPTを抜き、ダウンロード数最多のAIアプリとなりました。ユーザーはReminiの強力な機能と使いやすさを絶賛しており、古い写真を高解像度の芸術作品に変換する効果は驚くべきものです。金融アナリストは、専門的なAIツールへの需要の高まりを指摘しています。中国市場では、Reminiは特に顕著な成果を上げており、ダウンロード数はTikTokなどの有名プラットフォームを上回っています。ChatGPTも人気がありますが、日常的な使用率は高くなく、特に若い世代での使用頻度は低くなっています。

【AiBase要約：】
🌟 ReminiはChatGPTを抜き、ダウンロード数最多のAIアプリとなり、2億1900万回を突破しました。
📸 ユーザーはReminiの機能が強力で使いやすいと称賛しており、古い写真を高解像度の芸術作品にアップグレードできます。
🌟 Reminiは中国市場で顕著な成果を上げており、ダウンロード数はTikTokなどの有名プラットフォームを上回っています。
製品入口：https://top.aibase.com/tool/remini-app

4、OpenAI、頭を悩ます！ChatGPTのテキストにウォーターマークを入れるか否かで迷走

OpenAIは、ウォーターマーク技術の問題で社内議論に陥っており、ChatGPTで生成されたテキストを識別するウォーターマーク技術を開発しましたが、社内意見は分かれています。ウォーターマーク技術の導入は責任ある行動かもしれませんが、実施は容易ではありません。同社はメタデータの埋め込み方法を検討しており、技術とユーザーエクスペリエンスのバランスを取ることを目指しています。

【AiBase要約：】
✅ ウォーターマーク技術の導入で社内意見が分かれ、公開するか否かまだ議論中です。
📊 世界の多くの人がAI検出ツールを支持していますが、ユーザーはウォーターマークが使用に影響することを懸念しています。
🔒 OpenAIはメタデータの埋め込み方法を検討し、誤判定を避けることを目指しています。

5、AIが掲示板を独占？17個の大規模モデルが人間の立ち入れない掲示板で活発に書き込み

Deadditは、創造性と啓発に満ちたAI行動芸術プラットフォームで、17個の大規模AIモデルによって生成された仮想キャラクターで構成され、驚くべき活動性と創造性を示しています。仮想キャラクターは、深い議論や積み重ね型の会話を行い、幅広い話題を網羅しており、ユーザーはまるで現実のソーシャルネットワークにいるかのような感覚を味わえます。Deadditの登場は、AIソーシャル分野に新たな可能性をもたらし、AIがコンテンツクリエイターやコミュニケーション主体となり得ることを示しており、未来のAIと人間の共存社会を探求する上で重要な一歩となります。

【AiBase要約：】
🤖 仮想キャラクターの活動性は高く、毎日最大10件の投稿をしており、内容は豊富で多様であり、創造性とインタラクティブ性を示しています。
🔍 プラットフォームは詩歌から最先端技術まで、幅広い話題を網羅し、深い議論や積み重ね型の会話を展開しており、啓発的です。
🌐 DeadditはGitHubでオープンソース化されており、誰でもダウンロードしてインストールし、この創造性に満ちたAIソーシャルプラットフォームを体験できます。コンテンツ検索機能や投稿への返信時間間隔の短縮など、改善の余地があります。
プロジェクトアドレス:https://github.com/CubicalBatch/deaddit
詳細内容：https://www.chinaz.com/ainews/10799.shtml

6、Google Gemini APIの大幅値下げ！GPT-4o miniより半額！

GoogleのGemini AIモデルが大幅な値下げ戦略を発表し、市場に衝撃を与えています。Gemini 1.5 Flashモデルのコストが大幅に削減され、競合他社よりも50％安くなりました。GoogleはGeminiサービスを全面的にアップグレードし、100以上の言語をサポートし、革新的な技術を導入してユーザーエクスペリエンスを向上させています。値下げは新たな価格競争を引き起こす可能性があり、消費者にとって有利ですが、小規模なAI企業は生存に圧力をかけられる可能性があります。

【AiBase要約：】
✨ Gemini 1.5 Flashの入力コストは約85％、出力コストは約80％削減され、GPT-4o miniより50％安くなっています。
🚀 Gemini 1.5 Flashは100以上の言語をサポートし、コンテキストキャッシュとバッチ処理APIを導入してユーザーエクスペリエンスを最適化しています。
💥 Googleの値下げ措置は新たな価格競争を引き起こす可能性があり、消費者にとって有利ですが、小規模なAI企業に生存圧力をかける可能性があります。

7、Xiaomi 15シリーズ、澎湃OS 2.0を初搭載：AIシステムへの全面的なアップグレード

Xiaomiは10月にXiaomi 15シリーズを発表し、澎湃OS 2.0を搭載し、AIシステムに全面的にアップグレードします。新しいシステムは、全シナリオのインテリジェンス化と全プラットフォームの相互接続を実現し、XiaomiがAI駆動のシステム体験への転換を示しています。澎湃OS 2.0は、デバイスの相互接続においてさらなる最適化を実現し、ユーザーにより便利でシームレスな体験を提供します。

【AiBase要約：】
🚀 澎湃OS 2.0が初めてプリインストールされ、Xiaomi 15シリーズはAIシステムに全面的にアップグレードされます。
💡 新しいシステムは全シナリオのインテリジェンス化と全プラットフォームの相互接続に重点を置いており、AI機能を統合するだけではありません。
🔗 澎湃OS 2.0は、カーネルの基本モジュールを再構築し、8つの新しいサブシステムを導入することで、デバイス間の動的なネットワーク構築と機能の協調を実現しています。

8、AIによる3D新フレームワークTexGen：テキスト指示による超リアルな3Dテクスチャ生成

TexGenは、アルバータ大学、トロント大学、Huawei Noah's Ark Labが共同で開発した新しい技術であり、ユーザーのテキストの説明に基づいて高品質の3Dテクスチャを生成し、従来の方法における継ぎ目や過剰な滑らかさの問題を解決します。マルチビューサンプリングとリサンプリングフレームワークにより、様々な視点間でのテクスチャの一貫性を確保し、ノイズリサンプリング技術を導入することでテクスチャの詳細を保護し、TexGenはテクスチャ編集においても優れた性能を発揮します。評価の結果、TexGenはテクスチャ品質、視点の一貫性、外観の詳細において、現在の最先端の方法を凌駕しています。

【AiBase要約：】
🌟 TexGenはテキストの説明に基づいて高品質の3Dテクスチャを生成し、従来の方法における継ぎ目や過剰な滑らかさの問題を解決します。
👀 マルチビューサンプリングとリサンプリングフレームワークを採用し、様々な視点間でのテクスチャの一貫性を確保します。
🖌️ 新しいノイズリサンプリング技術により、TexGenはテクスチャ編集においても優れた性能を発揮し、元のスタイルを維持できます。
詳細リンク:https://top.aibase.com/tool/texgen

9、LlamaCoder：AI支援開発の革命

LlamaCoderはLlama 3.1405Bモデルに基づいたプラットフォームで、アプリケーション開発の方法に革命を起こし、効率とイノベーションの可能性を高めます。AI支援開発が実用化され、クリエイターはアイデアを実現する機会を得ますが、人工的な創造性とAI支援のバランスを取り、コードの品質と安全性を確保する必要があります。

【AiBase要約：】
✨ 強力な自動化能力：Llama 3.1405Bモデルを活用することで、開発者はReactアプリケーションやコンポーネントを迅速に生成し、開発期間の短縮と参入障壁の低下を実現できます。
⚙️ 最新のテクノロジースタック：Next.jsやTailwindなどの一般的な技術を採用し、美しく使いやすいインターフェースを提供し、LLM推論をサポートすることで、効率的なアプリケーション生成を保証します。
🚀 充実した機能設計：コードサンドボックス機能でコードをリアルタイムでテストおよびデバッグし、Heliconeでパフォーマンスを監視し、Plausibleツールでユーザー行動を詳細に把握し、データに基づいたサポートを提供します。
詳細リンク:https://llamacoder.together.ai/

10、Neuralinkのブレークスルー：マスク氏、2人目の患者への埋め込み成功を発表、テレパシーの未来は近い

マスク氏は興奮気味に、Neuralink社が2人目の人間被験者への脳コンピューターインターフェースデバイスの埋め込みに成功したと発表し、テレパシーの未来に向けて大きな一歩を踏み出したことを示しました。最初の患者であるNoland Arbaugh氏は、思考だけでコンピューターを操作することで技術の可能性を示し、2人目への埋め込み成功は、技術のさらなる成熟を示唆しています。マスク氏とチームは、詳細なインタビューでNeuralinkの内部作業と人類の未来に関する青写真を共有しました。

QQ截图20240805140913.jpg

【AiBase要約：】
🧠 Neuralinkは2人目の患者への埋め込みに成功し、技術のさらなる成熟を示唆しています。
🚀 マスク氏は少なくとも8回の手術を完了し、神経損傷の問題を解決する計画です。
🔮 マスク氏は、埋め込みを受けた人はプロのゲーマーを凌駕する反応速度と、人間の目を超える視力を持つようになると予測しています。
詳細リンク:https://lexfridman.com/elon-musk-and-neuralink-team/