【AI日報】へようこそ!ここは、人工知能の世界を探求するためのあなたの毎日のガイドです。毎日、AI分野のホットな話題をお届けし、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用に関する情報を提供します。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、智譜 AI 全モデル価格改定、清言スマートエージェントセンターに羅永浩氏の「AI老羅」が登場
智譜AIは智譜AI Open Dayで、複数のモデルの価格を大幅に値下げすると発表しました。同社の清言Appでは30万を超えるスマートエージェントがアクティブで、1日のトークン呼び出し回数は400億回に達しています。羅永浩氏のAIスマートエージェントが智譜清言Appのスマートエージェントセンターに正式に入居し、社員番号は001で、一般公開されます。
【AiBase要約:】
🚀 智譜AIはGLM-4-AirとGLM-3-Turboモデルの価格を100万トークンあたり0.6元、Embedding-2モデルを100万トークンあたり0.3元としました。
💡 GLM-4-Flashモデルは最大で100万トークンあたり0.06元まで値下げされました。
📈 清言Appでは30万を超えるスマートエージェントがアクティブで、1日のトークン呼び出し回数は400億回に達しています。
詳細リンク:https://top.aibase.com/tool/zhipuqingyan
2、ComfyUIタイムラインシステムTimeUi:コンテンツの追加、削除、並べ替えを迅速に行えます
この記事では、ビデオ編集ツールのタイムラインインターフェースに似たComfyUIタイムラインシステムであるTimeUiを紹介します。ユーザーはコンテンツを迅速に追加、削除、または並べ替えることができ、スムーズなユーザーエクスペリエンスを提供します。TimeUiは便利な画像アップロードと管理機能を提供し、カスタム設定やさまざまなパラメーター調整をサポートします。また、さまざまな時間形式と継続時間単位、ベジエ曲線機能にも対応し、ユーザーにより強力で柔軟なタイムラインノードシステムを提供します。
【AiBase要約:】
⭐ ユーザーは画像をノードに直接アップロードしたり、他の「画像アップロード」ノードを追加したりして、ワークフローを簡素化できます。
⭐ 各タイムライン行には、画像マスクの表示/非表示の切り替えなど、さまざまなカスタム設定が含まれており、出力を簡単に微調整できます。
⭐ タイムラインの時間形式とアニメーションの継続時間を変更し、フレームまたは秒単位を選択できます。ベジエ曲線機能にも対応しています。
製品入口:https://top.aibase.com/tool/timeui-a-comfyui-timeline-node
詳細:https://www.chinaz.com/2024/0605/1621434.shtml
3、最強のサポートが登場!Backseat AI:リーグ・オブ・レジェンドの無料AIゲームコンパニオン
Backseat AIはRiot Gamesが承認した無料のAIコンパニオンで、リーグ・オブ・レジェンドのプレイヤー向けに設計されており、ゲームのパフォーマンス向上を支援することを目的としています。プレイヤーは音声オーバーレイとゲーム内コメントを通じて、アイテム購入の提案やレーン戦の戦略など、リアルタイムのゲームアドバイスを受けることができます。AIコンパニオンはシステムリソースを過剰に消費せず、クリエイターの創作活動と発展をサポートします。
【AiBase要約:】
🎮 アイテム購入の提案やレーン戦の戦略など、リアルタイムのゲームコメントとアドバイスを提供します。
🤖 主要機能には、Backseat Buddyによるリアルタイムのコメントとインサイト、試合後のロビーでの試合サマリー、プレゲームアドバイスによる準備支援などがあります。
💡 今後のバージョンでは、リアルタイムのQ&A機能やさまざまなクリエイターの音声パックが追加され、より多くの言語サポートとパーソナライズされたエクスペリエンスを提供する予定です。
詳細リンク:https://top.aibase.com/tool/backseat-ai
4、面壁智能が小鋼炮モデルMiniCPMの無料商用利用を発表
面壁智能は、面壁「小鋼炮」MiniCPMの無料商用利用を発表し、オープンソースコミュニティへの信念と愛情を示しました。MiniCPM-Llama3-V2.5はオープンソースコミュニティへの特別な贈り物であり、エッジ側マルチモーダルモデルとして世界的に注目されています。視覚障害者にとって特に役立ち、強力なOCR機能を提供し、ドキュメントの読みやすさを向上させます。
【AiBase要約:】
🎁 MiniCPM-Llama3-V2.5は8Bパラメーターのエッジ側マルチモーダルモデルで、Gemini ProやGPT-4Vを上回り、30以上の言語をサポートしています。
💼 MiniCPMとMiniCPM-Vモデルは、学術研究に公開され、商用利用も許可されています(Apache2.0および『MiniCPMモデルコミュニティライセンス契約』に従う必要があります)。
🚀 MiniCPM-Llama3-V2.5は、最先端のOCR能力を備え、モバイルデバイスで効率的に動作し、画像エンコーディング速度は150倍高速です。
詳細リンク:https://modelbest.feishu.cn/share/base/form/shrcnpV5ZT9EJ6xYjh3Kx0J6v8g
5、Coze Botsユーザー利用状況データ分析
この記事では、Xのブロガー@eviljerがCoze Botsのデータ分析と視覚化チャートを共有し、ゲームと教育カテゴリの割合が最も高いことを強調しています。データ分析により、さまざまなカテゴリの人気を視覚的に理解し、発展状況を把握できます。
【AiBase要約:】
📊 ゲームと教育カテゴリの割合が最も高く、それぞれ20.6%と19.2%です。ロールプレイングカテゴリも11.9%と好調です。
📈 データの集中度から、ライフスタイル、ゲーム、効率性ツールカテゴリがリードし、学習教育カテゴリは開発の余地があります。
📉 Coze Botsの10大カテゴリデータは、ゲーム、学習教育、公開設定、ロールプレイング、効率性、テキスト作成、画像音声ビデオ、ライフスタイル、ビジネスサービス、コードアシスタントです。
6、True Fitが生成AIを活用してオンラインショッピング客にぴったりの服探しを支援
True Fitは新しい機能「Fit Hub」を発表しました。これは生成AIを活用して、オンラインショッピング客が自分の体型に合った服を見つけやすくするものです。製品ページの情報を統合することで、ショッピング客は商品をすばやく理解し、適切なサイズを決定し、返品率を削減できます。「Shopper Insights」や「Brand Sizing」などの機能も追加する予定で、よりパーソナライズされたショッピング体験を提供します。
【AiBase要約:】
⭐️ True Fitは新しい機能「Fit Hub」を発表し、生成AIを活用してオンラインショッピング客が自分の体型に合った服を見つけやすくしています。
⭐️ Fit Hubは製品ページの情報を統合し、ショッピング客が商品をすばやく理解し、適切なサイズを決定し、返品率を削減します。
⭐️ 「Shopper Insights」や「Brand Sizing」などの機能も追加する予定で、よりパーソナライズされたショッピング体験を提供します。
7、AppleがWWDCでiOS18を発表、人工知能技術を全面的に統合
AppleはWWDCで発表予定のiOS18に人工知能技術を全面的に統合し、期待の新機能と改良を提供します。今回のアップデートでは、Siri、Apple Photos、録音、NotesアプリへのAIサポート、iMessagesのAIアップデート、その他のAI機能が含まれており、AppleがAI技術をオペレーティングシステムのあらゆる側面に統合することに取り組んでいることを示しています。
【AiBase要約:】
🌟 Siriのアップグレード:Siriはアプリケーション内の機能を制御し、Apple Watchにログインし、より自然でスムーズな音声になり、通知を要約する機能を備えます。
📸 Apple Photosの新機能:インターフェースが全面的に更新され、「クリーンアップ」機能が導入され、AIを使用して写真を修正し、内部でGenerative Playgroundアプリケーションが開発されています。
🔊 録音とNotesアプリのAIサポート:AIがメモを要約し、音声コンテンツをメモに転写します。Math Notesは図の作成と方程式の解法を支援します。
8、CamCo:カメラ制御可能な3D整合性のある画像からビデオへの生成
この記事では、Plücker座標とエピポーラ制約注意機構を導入することで3D整合性を実現し、構造光アルゴリズムを使用して現実世界のビデオを微調整することでオブジェクトモーションの合成効果を改善した、CamCoという新しい画像からビデオへの生成フレームワークを紹介します。CamCoはカメラ制御能力と3D整合性の点で顕著な改善が見られ、高品質で自然なオブジェクトモーションビデオを生成できます。
【AiBase要約:】
🔍 CamCoはカメラ制御可能な3D整合性のある画像からビデオへの生成フレームワークで、Plücker座標とエピポーラ制約注意機構を導入することで3D整合性を実現しています。
🔍 各注意機構モジュールにエピポーラ制約注意機構を統合し、構造光アルゴリズムを使用して現実世界のビデオを微調整することで、オブジェクトモーションの合成効果を改善しています。
🔍 CamCoはデータ選別プロセスを使用して現実世界のビデオを処理し、カメラの自己運動と動的な被写体を持つビデオの生成能力を高めています。
詳細リンク:https://top.aibase.com/tool/camco
9、NVIDIA RTX Remix moddersがComfyUIノードに対応
NVIDIAのRTX Remix moddersは、ComfyUIと互換性のある新しいノードを発表し、ゲームモッド作成とリソース強化に大きな進歩をもたらしました。モッド作成者はComfyUIインターフェースでゲームアセットの拡大と再描画を行い、編集とアップグレードのプロセスを簡素化できます。この取り組みは超解像度とPBRモデルを提供し、ゲームの視覚効果を改善し、プレイヤーの没入感を高めます。
【AiBase要約:】
🎮 モッド作成者はComfyUIインターフェースでゲームアセットの拡大と再描画を直接行い、編集とアップグレードのプロセスを簡素化できます。
🔧 新しいノードを使用することで、モッド作成者はRTX RemixのゲームテクスチャをComfyUIにエクスポートし、AIモデルを使用して一括で強化できます。
🌟 RTX Remix Toolkitは強力なREST APIを備えており、モッド作成者がDirectX8とDirectX9ゲームを現代化して再制作し、RTX再制作プロジェクトの革新と発展を促進します。
詳細リンク:https://www.nvidia.com/en-us/geforce/news/rtx-remix-rest-api-comfyui-app-connectors/
10、智譜AIがGLM第4世代モデルGLM-4-9Bのオープンソース化を発表
智譜AIチームは2023年3月14日にGLM-4-9Bモデルをオープンソース化し、大きな注目を集めました。このモデルは、事前学習において大規模言語モデルによるデータ選別を導入し、学習効率を3.5倍向上させています。GLM-4-9Bは、より強力な推論性能、より長いコンテキスト処理能力、多言語、マルチモーダル、All Toolsなどの機能を備えています。
【AiBase要約:】
🚀 GLM-4-9Bモデルがオープンソース化され、大きな注目を集めています。
💡 事前学習に大規模言語モデルを採用し、学習効率を3.5倍向上させています。
🔥 GLM-4-9Bは、強力な推論性能、多言語、マルチモーダル、All Tools能力を備えています。
詳細リンク:https://github.com/THUDM/GLM-4
11、マスク氏のGrokがxAIウェブサイトで単独アクセス可能に
マスク氏が開発したGrokは、現在xAIウェブサイトで単独アクセス可能になりました。このツールは、xAIプラットフォームでの機能が、以前Twitterで公開されたバージョンよりも豊富です。特に注目すべきは、ブランチツリーモードで、ユーザーは複数回の会話で発生する可能性のあるさまざまな回答パスを観察でき、会話の流れの分析と理解に非常に役立ちます。Grok-1.5Visionモデルは、複数のベンチマークテストで卓越した性能を示し、業界をリードするGPT4Vモデルを上回り、特にRealWorldQAベンチマークテストで優れた結果を出しました。
【AiBase要約:】