【AI日報】へようこそ!ここは、人工知能の世界を探求するあなたのための毎日のガイドです。毎日、AI分野のホットなニュースをお届けし、開発者に焦点を当て、技術トレンドの把握や革新的なAI製品の応用に関する理解を支援します。

最新のAI製品はこちらからご覧ください:https://top.aibase.com/

1、DeepSeekが初の推論モデルR1-Lite-Previewを発表、OpenAI o1を上回る性能

DeepSeekが最近発表したR1-Lite-Previewモデルは、推論能力において優れた性能を示し、OpenAIのo1-previewを上回りました。この革新は、透明性の高い推論プロセスを示すだけでなく、ユーザーに論理ステップをリアルタイムで観察する機会も提供します。DeepSeekは今後、オープンソース版とAPIを公開し、オープンソースAIコミュニティの発展をさらに推進する予定です。

image.png

【AiBase要約:】

🌟 DeepSeekがR1-Lite-Previewモデルを発表、OpenAI o1に匹敵し、それを上回る性能。

📊 モデルは透明性の高い推論プロセスを示し、ユーザーは論理ステップをリアルタイムで観察可能。

🔍 深層学習と論理推論能力が顕著で、今後オープンソース版とAPIが公開される予定。

詳細はこちら:https://www.deepseek.com/

2、快手程一笑氏:可灵AIのユーザー数が500万人を突破、月間売上高が1000万元を超える

快手科技は、2024年第3四半期の業績で、売上高が311億元を超え、純利益が39億元に達したことを発表しました。程一笑氏は、可灵AIのユーザー数が500万人に達し、1080Pビデオ生成をサポートしており、商業化が大きく進み、月間売上高が1000万元を超えていると説明しました。今後は、多様な収益化モデルの探求を続け、AIとビジネスシーンの連携を図り、より大きな商業価値の創造を目指します。

【AiBase要約:】

📈 第3四半期の売上高は311億3000万元に達し、前年同期比11.4%増と市場予想を上回る。

🤖 可灵AIは発表以来、500万人を超えるユーザーを獲得し、月間アクティブユーザー数は150万人を突破、月間売上高は1000万元を超える。

💡 快手科技は、AI大規模モデルを短編動画、ライブ配信などの複数のシーンへの適用を推進し、アルゴリズムの革新と商業価値の向上を目指している。

3、アリババが100を超えるオープンソースモデルを発表、30万社以上が通義大規模モデルに接続

2024年の世界インターネット大会で、アリババCEOの呉泳銘氏は、人工知能がインターネット業界に与える深遠な影響を強調し、アリババが発表した100を超えるオープンソースモデルと、30万社以上が通義大規模モデルに接続している状況を紹介しました。AIが各業界の生産性革命を推進すると指摘し、アリババは引き続き計算コストの削減を進め、AI技術の発展を促進すると述べました。

image.png

【AiBase要約:】

🌟 AI技術は今年のインターネット業界における主要な変化であり、生産性革命を推進している。

📈 アリババは現在、30万社以上の企業が通義大規模モデルを使用しており、オープンソースモデルの数は100を超える。

💰 推論コストが大幅に削減され、阿里雲はAI計算コストの更なる削減に取り組み、業界の発展を促進している。

4、AI版『マトリックス』登場!The Matrixが720pビデオの無限生成を実現、3A画質

人工知能技術の急速な発展に伴い、「The Matrix」と呼ばれるAIベースの世界シミュレーターが正式に発表されました。高精細な720pのリアルなシーンビデオを無限に生成でき、リアルタイムインタラクションもサポートし、かつてない仮想体験を提供します。

image.png

【AiBase要約:】

🌐 AI版『マトリックス』シミュレーター「The Matrix」が登場、720pビデオの無限生成をサポート。

🎮 ユーザーはビデオシーンをリアルタイムで制御でき、毎秒16フレームのダイナミックな映像を体験可能。

🚀 この技術はゼロショット汎化能力を備え、異なる環境における物体の挙動を予測できる。

詳細はこちら:https://thematrix1999.github.io/

5、次元壁崩壊?Comfyui_Object_Migrationは一键换装だけでなく、実写も3Dモデルに瞬時に変換可能

Comfyui_Object_Migration技術により、ユーザーは服装画像と人物写真をアップロードするだけで、「一键换装」を簡単に実現できます。この技術は、異次元の服装スタイル変換を実現するだけでなく、高品質の3Dモデルも生成し、デザイナーや二次元愛好家に大きな利便性をもたらします。

【AiBase要約:】

👗 一键换衣機能:ユーザーは服装と人物の画像をアップロードするだけで、簡単に服装の移行を実現し、自然でリアルな効果を得られる。

🧵 異次元換装:漫画風の服装を写実的なスタイルに変換でき、次元壁を打ち破り、様々な創造的なニーズに応える。

🖥️3Dモデル生成:二次元キャラクターデザインを三次元モデルに変換し、カスタムアクションと高精細レンダリングをサポートし、様々な用途に適している。

詳細はこちら:https://github.com/TTPlanetPig/Comfyui_Object_Migration/blob/main/workflow/3D_Figures_transfer_workflow_v1.json

6、NVIDIAのBlackwell AIチップが量産開始、業績が過去最高を更新

NVIDIAのBlackwell AIチップが正式に量産段階に入り、同社の業績の継続的な成長を推進しています。AI事業の収益が大幅に増加しており、AI技術に対する市場の強い需要を示しています。競争圧力に直面しながらも、NVIDIAはAI分野で依然としてトップの地位を維持しています。

【AiBase要約:】

🌟 NVIDIAのBlackwell AIチップが量産開始、業績の継続的な成長が見込まれる。

📈 今四半期のNVIDIAデータセンターのAI関連収入は307億ドル、利益は193億ドル。

🚀 AMDもAIチップの開発を加速させ、市場のニーズに対応するための転換を図っている。

7、glifが新たな人気機能を発表!AIを使ってロゴ関連グッズを制作、一键で超クールな個性的なデザインを生成!

最近、glifはIn-Context LoRAに基づいた革新的な技術を発表し、ロゴを驚くほど魅力的な関連グッズのデザインに変換できます。この革新的なデザインプロセスは3つのステップに分かれており、AIがクリエイティブデザイン分野における巨大な可能性を示しており、デザイナーやブランド側に画期的なパーソナライズされた創作ツールを提供します。

image.png

【AiBase要約:】

🖼️ ロゴ画像の特徴を正確に捉え、プロンプトを使って主要な視覚要素を抽出し、構成とデザインの特徴を分析する。

💡 大規模言語モデルを使ってロゴの「DNA」を再構成し、新しい生命形態を与える、カスタマイズされたプロンプトをインテリジェントに生成する。

✨ ComfyUIを使ってレンダリングを行い、スタイルが統一された関連グッズのデザインを迅速に生成し、クリエイティブデザインの効率を向上させる。

詳細はこちら:https://glif.app/glifs/cm3o7dfsd002610z48sz89yih

8、脳みそ溶ける動画学習法がTikTokで話題に:AI学習ツールは真のイノベーションか、それともマーケティングの策略か?

「PDFを脳みそ溶ける動画に変換」という新しいAI学習ツールがTikTokで話題になっています。教材の内容をAI音声に変換し、リラックスできる動画と組み合わせることで、若いユーザーを引きつけています。この学習方法は、場合によっては学習の面白さを向上させますが、学習内容の歪曲やマーケティングの信憑性に関する懸念も引き起こしています。専門家は、このツールに過度に依存すると学習効果が低下する可能性があると警告しています。

image.png

【AiBase要約:】

🎮 このツールは教材の内容をAI音声に変換し、ASMRやゲーム画面と組み合わせることで、独自の学習環境を作り出す。

📈 マーケティング上の論争はあるものの、この学習方法は一部の生徒に新たな可能性を提供し、集中力の向上に役立つ。

⚠️ 専門家は、過度の依存は学習内容の歪曲につながる可能性があり、AIが生成した流行語バージョンは元の知識を歪める可能性があると警告している。

9、aiOlaがオープンソースAI音声転写モデルWhisper-NERを発表、リアルタイムで機密情報を保護

aiOlaは、オープンソースAI音声転写モデルWhisper-NERを発表しました。このモデルは、個人名や電話番号などの機密情報を転写中にリアルタイムでマスキングできます。このモデルはOpenAIのWhisperをベースにしており、複数の言語とアクセントに対応し、法律、医療などの分野に適しています。開発者はモデルをカスタマイズして最適化し、AI技術の革新と発展を促進できます。

image.png

【AiBase要約:】

📌 Whisper-NERモデルは機密情報をリアルタイムでマスキングし、ユーザーのプライバシーを保護する。

🔍 このモデルは複数の言語とアクセントに対応し、法律、医療、教育など様々な分野に適している。

💻 オープンソースであるため、ユーザーはモデルをカスタマイズして最適化し、AI技術の革新を促進できる。

詳細はこちら:https://huggingface.co/aiola/whisper-ner-v1

10、OpenAI CEOの年収が明らかに:昨年の年収はわずか76,001ドル、しかし資産は20億ドルに上る

OpenAIのCEO、サム・アルトマン氏の2023年の年収は76,001ドルでした。給与は低めですが、彼の純資産は約20億ドルに達しています。アルトマン氏は短期的な利益ではなく、会社の長期的な発展とイノベーションに注力しており、これが彼の経営理念を表しています。彼のリーダーシップの下、OpenAIは最先端の製品を次々と発表し、人工知能分野におけるトップの地位を確固たるものとしています。

【AiBase要約:】

🌟 アルトマン氏の2023年の年収は76,001ドルで、2022年比3.4%増。

💰 純資産は約20億ドルと推定され、テクノロジー業界における彼の成功を示している。

🚀 アルトマン氏はOpenAIの長期的な発展に注力しており、イノベーションを重視し短期的な利益を軽視する経営理念を反映している。