清華大学＆智譜AI、マルチモーダル大規模言語モデルCogVLMを発表

始智AI wisemodel

公開日AIニュース · 1 分で読めます · Oct 12, 2023

706

清華KEG＆智譜AIが発表した多様なモデルCogVLM

清華大学KEGと智譜AIは、新たな最先端多様なモデルCogVLMを発表しました。この次世代モデルは、視覚と言語の特徴を深く融合させています。

CogVLM-17Bは、複数のデータセットにおいて最先端または2位の成績を収め、優れた性能を備えています。このモデルの構造は、ViTエンコーダー、MLPアダプター、事前学習済み大規模言語モデル、そして視覚専門家モジュールで構成されています。

CogVLMは15億枚の画像・テキストペアで事前学習されており、多様なベンチマークにおいて満足のいく結果を示しています。他のモデルと比較して、CogVLMは画像理解、モデルの幻覚、テキスト認識において優れた性能を発揮します。

さらに、このモデルはオープンソース化されており、多様なモデルの研究と応用分野における更なる発展を促進します。この発表は、多様な基盤モデルの研究を推進し、多様な理解を実現し、スマートアプリケーションの基盤を築くことを目的としています。

マルチモーダル大規模言語モデル人工知能視覚言語モデル

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

モトローラの新Razr携帯電話、複数のAI技術を搭載　OpenAIの不在が注目を集める

Apr 28, 2025

Meta、Nvidia、HPが共同で宇宙AIプロジェクト「Space Llama」を開発

Apr 28, 2025

清華大学、人工知能病院を開設し、スマート医療の新時代へ

清華大学は人工知能を活用した病院を開設し、医療における革新的な技術導入と、より高度な医療サービスの提供を目指しています。この新たな取り組みは、スマート医療の未来を切り開く重要な一歩となるでしょう。

Apr 27, 2025

AI生成映画『海上女王鄭一嫂』が世界初上映　上映時間70分

シンガポールの映画制作会社FizzDragonが制作した70分の中国語AIGC（人工知能生成コンテンツ）映画『海上女王鄭一嫂』が、シンガポールで劇場公開されました。これは、AI技術を用いて制作された長編映画が商業映画館で公開された世界初の事例となります。18世紀の中国の伝説的な女海賊、鄭一嫂を題材としており、その人物像は『パイレーツ・オブ・カリビアン』シリーズの「チィエン夫人」の創作にも影響を与えたと言われています。

Apr 25, 2025

イーロン・マスクのxAI、メンフィスで汚染問題を引き起こす

イーロン・マスクの人工知能企業xAIが、テネシー州メンフィスで最近論争を引き起こしている。同社は、事業運営を支援するため、この地域に巨大なスーパーコンピューターを建設中だ。しかし、昨年夏にスーパーコンピューターが稼働開始されて以来、地域住民や環境活動家は、この施設が地元における主要な大気汚染源の一つになっていると主張している。画像出典：画像はAIによって生成され、画像ライセンスプロバイダーMidjourneyから提供されています。この問題について、メンフィス市保健局は、金曜日に最初の公開公聴会を開催する予定だ。

Apr 25, 2025

アップルのAI戦略の大幅変更：Siriのトップ交代に続き、謎のロボットチームがハードウェア部門に移管

テクノロジー大手アップル社は、最近、人工知能（AI）部門に再び大きな変更を加えました。関係者によると、アップルは今月末、秘密裏に進められていたロボット技術部門を、AI担当のジョン・ジャナンドレア氏から、ハードウェアエンジニアリング担当上級副社長のジョン・ターナス氏に移管する計画です。この変更は、3月に低調なパフォーマンスを見せていたSiriの音声アシスタント部門をジャナンドレア氏から移管したことに続くものです。一連の…

Apr 25, 2025

モトローラとPerplexity AI、新たなスマートフォンのアシスタントを発表

Apr 25, 2025

報道によると、アップルが管理層を再編し、AIとロボットのプロジェクトを分離

Apr 25, 2025

Google I/O 2025展望：Material 3、Android XR、ジェネレーティブAIが開発者体験を刷新

本日の午前中に開催されたGoogle I/O 2025カンファレンスで、Googleは人工知能、没入型体験、開発ツールにおける最新の進歩をさらに示す、一連の刺激的な新技術を発表しました。主なハイライトは以下の通りです。1. Material 3 Expressive：感情的なデザインの未来Googleは今回のカンファレンスで、Material 3 Expressiveを発表します。この全く新しいデザインシステムは、Googleのユーザーエクスペリエンスデザインの未来として説明されています。Material 3 Ex...

Apr 24, 2025

セコイア・キャピタル、AIスタートアップListen Labsに2700万ドルを投資、市場調査業界に革命を起こす

Apr 24, 2025

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

清華大学＆智譜AI、マルチモーダル大規模言語モデルCogVLMを発表

始智AI wisemodel

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

モトローラの新Razr携帯電話、複数のAI技術を搭載 OpenAIの不在が注目を集める

Meta、Nvidia、HPが共同で宇宙AIプロジェクト「Space Llama」を開発

清華大学、人工知能病院を開設し、スマート医療の新時代へ

AI生成映画『海上女王鄭一嫂』が世界初上映 上映時間70分

イーロン・マスクのxAI、メンフィスで汚染問題を引き起こす

アップルのAI戦略の大幅変更：Siriのトップ交代に続き、謎のロボットチームがハードウェア部門に移管

モトローラとPerplexity AI、新たなスマートフォンのアシスタントを発表

報道によると、アップルが管理層を再編し、AIとロボットのプロジェクトを分離

Google I/O 2025展望：Material 3、Android XR、ジェネレーティブAIが開発者体験を刷新

セコイア・キャピタル、AIスタートアップListen Labsに2700万ドルを投資、市場調査業界に革命を起こす

モトローラの新Razr携帯電話、複数のAI技術を搭載　OpenAIの不在が注目を集める

AI生成映画『海上女王鄭一嫂』が世界初上映　上映時間70分