ja
AI製品ランキング
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
ホーム
AIニュース
AIデイリー
マネタイズガイド
AIチュートリアル
AIツールナビ
AI製品ライブラリ
ja
AI製品ランキング
グローバルAI製品の動向を検索
グローバルAI情報を検索して、AIの新しい機会を発見
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
タイプ :
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
2024-12-18 17:52:23
.
AIbase
.
14.1k
多モーダルモデルの新突破:李飛飛チームが動作と言語を統一、指示理解を超え、潜在的な感情も読み解く
李飛飛チームは、人間の動作を理解・生成し、言語モデルと組み合わせることで口頭・非言語の統一処理を実現する新たな多モーダルモデルを発表しました。この画期的な研究により、機械は人間の指示を理解するだけでなく、動作に含まれる感情を読み解き、より自然なヒューマンコンピュータインタラクションが可能になります。本モデルの中核は、音声、動作、テキストなど多様な形式の入力を受容し、必要なモーダルデータを出力する多モーダル言語モデルフレームワークにあります。生成系事前学習戦略と組み合わせることで、モデルは…
2024-09-26 14:34:11
.
AIbase
.
12.0k
オープンソース多モーダルモデルMolmo、画像内の物体を認識し正確な説明を生成
最近、Molmoというオープンソースの多モーダルAIモデルが業界で大きな注目を集めています。OpenAIのCLIPをビジョン処理エンジンとして使用し、Qwen2-72BをベースとしたこのAIシステムは、その優れた性能と革新的な機能で、従来の商用モデルの覇権に挑戦しています。Molmoの顕著な特徴はその高い性能です。比較的サイズが小さいにもかかわらず、処理能力は10倍規模の競合他社に匹敵します。この小さくても強力な設計思想は、モデルの効率性を高めることに貢献しています。
2024-06-25 17:57:14
.
AIbase
.
9.8k
アップル、21種類の異なるモダリティを処理可能な万能ビジョンモデル「4M-21」を発表
アップルとスイス連邦工科大学ローザンヌ校(EPFL)の研究者らが共同で開発した、任意のモダリティ間の変換が可能な単一モデル。数十種類にも及ぶ多様なモダリティでトレーニングされ、大規模なマルチモーダルデータセットとテキストコーパスを協調して学習しています。4M-21と名付けられたこのモデルは、21種類の異なるモダリティでトレーニングされており、既存のモデルと比較して少なくとも3倍以上のタスクをこなすことができ、パフォーマンスの低下もありません。