AIニュース

AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

AIマネタイズガイド

最新事例

AIマネタイズ事例の共有

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

最新チュートリアル

最新のAIチュートリアルを無料で共有

AIプロダクトランキング

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

人気のある国ランキング

アメリカ合衆国

米国のユーザーに最も人気のあるAIウェブサイト

中国

中国のユーザーに最も人気のあるAIウェブサイト

インド

インドのユーザーに最も人気のあるAIウェブサイト

ブラジル

ブラジルのユーザーに最も人気のあるAIウェブサイト

人気のあるカテゴリランキング

画像生成

AI画像生成ウェブサイトの総訪問数ランキング

パーソナルアシスタント

AIパーソナルアシスタントウェブサイトの総訪問数ランキング

キャラクター生成

AIキャラクター生成ウェブサイトの総訪問数ランキング

ビデオ生成

AIビデオ生成ウェブサイトの総訪問数ランキング

人気のあるオープンソースデータランキング

AIプロジェクトランキング

GitHubの人気のあるAIプロジェクトを総スター数でランキング

AIプロジェクト成長ランキング

GitHubの人気のあるAIプロジェクトを成長率でランキング

AI開発者ランキング

GitHubの人気のあるAI開発者ランキング

AI組織ランキング

GitHubの人気のあるAI組織ランキング

人気のあるオープンソースカテゴリ

Deepseek

GitHubの人気のあるDeepseekオープンソースプロジェクト

TTS

GitHubの人気のあるTTSオープンソースプロジェクト

LLM

GitHubの人気のあるLLMオープンソースプロジェクト

ChatGPT

GitHubの人気のあるChatGPTオープンソースプロジェクト

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

Infini-attention

Transformerモデルを拡張し、無限長の入力を処理できるようにする技術

一般製品その他Transformer大規模言語モデル

ウェブサイトを開く

Googleが開発した「Infini-attention」技術は、Transformerベースの大規模言語モデルを拡張し、無限長の入力を処理することを目指しています。圧縮メモリ機構により無限長の入力処理を実現し、複数の長シーケンスタスクで優れた性能を発揮します。技術的手法には、圧縮メモリ機構、局所的および長期的な注意機構の組み合わせ、ストリーミング処理能力などが含まれます。実験結果では、長文脈言語モデル、キーコンテキストブロック検索、書籍要約タスクにおいて性能優位性が示されています。

Infini-attention

ウェブサイトを開く

Infini-attention 最新のトラフィック状況

月間総訪問数

20415616

直帰率

44.33%

平均ページ/訪問

3.1

平均訪問時間

00:04:06

Infini-attention 訪問数の傾向

Infini-attention 訪問地理的分布

Infini-attention トラフィックソース

Infini-attention 代替品

Infini-attention — Transformerモデルを拡張し、無限長の入力を処理できるようにする技術

•Transformer•大規模言語モデル

MoBA — MoBAは、長文コンテキストに対応した混合ブロックアテンション機構であり、大規模言語モデルの効率化を目的としています。

•大規模言語モデル•アテンション機構

Llama-3.3-70B-Instruct — 70億パラメーターの多言語大規模言語モデル

プログラミング

•大規模言語モデル•多言語

MindSearch — Perplexity.ai Proに匹敵する性能を持つ、オープンソースのAI検索エンジンフレームワーク。

プログラミング

•検索•transformer

SpaceByte — SpaceByteは、トークナイゼーションの欠点を回避する、新しいバイトレベルのデコードアーキテクチャです。

プログラミング

•バイトレベルモデル•大規模言語モデル

Argo — 自分自身の大規模モデルを簡単に構築し、専用の知恵をローカルで実現します。

中国セレクション

•大規模言語モデル•ローカル展開

NotaGen — NotaGen は、大規模言語モデルのトレーニングパラダイムを採用し、高品質のクラシック音楽楽譜の生成に特化した、記号音楽生成モデルです。

•音楽生成•大規模言語モデル

AoT — Atom of Thoughts (AoT)は大規模言語モデルの推論性能を向上させるためのフレームワークです。

プログラミング

•大規模言語モデル•推論フレームワーク

語析Yuxi-Know — 大規模言語モデルRAGナレッジベースに基づく知識グラフQ&Aシステムで、複数の主要な言語モデルへの対応とローカル展開をサポートしています。

•知識グラフ•大規模言語モデル

QwQ-32B — QwQ-32Bは、複雑な問題解決とテキスト生成のために設計された、強力な推論モデルであり、優れたパフォーマンスを発揮します。

•推論•テキスト生成

ART — 可変多層透明画像生成のための匿名領域変換技術です。

•画像生成•多層透明画像

Level-Navi Agent-Search — Level-Navi Agentは、トレーニングなしで使用できるフレームワークであり、大規模言語モデルを使用して、深層クエリ理解と正確な検索を実行します。

プログラミング

•大規模言語モデル•ウェブ検索

M2RAG — マルチモーダルコンテキストにおける検索強化生成のためのベンチマークテストコードリポジトリです。

プログラミング

•マルチモーダル•検索強化生成

SWE-RL — 強化学習により、オープンソースソフトウェアの進化における大規模言語モデルの推論能力を向上させます。

プログラミング

•強化学習•大規模言語モデル

TableGPT2-7B — TableGPT2-7Bは、表データ処理に特化した大規模言語モデルであり、データ分析やビジネスインテリジェンスのタスクに最適です。

•表データ•データ分析

Coding-Tutor — 大規模言語モデルをプログラミング指導ツールとして活用する可能性を探求し、Trace-and-Verifyワークフローを提案します。

•プログラミング教育•大規模言語モデル

百宝箱Tbox

百宝箱Tbox — アリペイの生活シーンに基づき、最先端の大規模言語モデル技術を活用して、企業が専門的なインテリジェントエージェントを迅速に構築できるように支援します。

中国セレクション

•大規模言語モデル•インテリジェントエージェント

Goedel-Prover — Goedel-Proverは、数学問題の形式化証明に特化したオープンソースの自動定理証明モデルです。

プログラミング

•自動定理証明•数学

OmniParser-v2.0 — OmniParserは、UIスクリーンショットを構造化されたフォーマットに変換し、LLMベースのUIエージェントのパフォーマンスを向上させる汎用スクリーン解析ツールです。

•スクリーン解析•画像認識

DMXAPI — DMXAPIは、300種類以上の大規模言語モデル（LLM）APIを統合するグローバルなプラットフォームです。

中国セレクション

•大規模言語モデル•API

Mistral-Small-24B-Instruct-2501 — Mistral Small 24Bは、多言語に対応した高性能な命令微調整大型言語モデルであり、幅広い用途に使用できます。

•大規模言語モデル•多言語対応

MNN大規模言語モデル Androidアプリ — 多様なモダリティに対応した、フル機能の巨大言語モデルAndroidアプリです。

•大規模言語モデル•マルチモーダル

Janus-Pro-1B — Janus-Pro-1Bは、統一的な多様なモダリティを理解し生成する自己回帰フレームワークです。

•多様なモダリティ•画像生成

Baichuan-M1-14B — 百川智能が開発した、医療現場向けに最適化されたオープンソースの大規模言語モデルです。優れた汎用性と医療分野での高い性能を備えています。

•大規模言語モデル•医療

Doubao-1.5-pro — Doubao-1.5-proは、推論性能とモデル能力の究極的なバランスに重点を置いた、高性能なスパースMoE（Mixture of Experts）大規模言語モデルです。

中国セレクション

•大規模言語モデル•マルチモーダル

DeepSeek-R1-Distill-Llama-70B — DeepSeek-R1-Distill-Llama-70Bは、強化学習によって最適化された大規模言語モデルであり、推論と対話能力に特化しています。

プログラミング

•大規模言語モデル•強化学習

PaSa — PaSaは、大規模言語モデルを駆使した高度な学術論文検索エージェントであり、自律的に意思決定を行い、正確な結果を取得します。

•学術検索•大規模言語モデル

InternVL2_5-78B-MPO — これは、優れた総合性能を示す高度なマルチモーダル大規模言語モデルシリーズです。

•マルチモーダル•大規模言語モデル

自己適応型LLM — 未経験のタスクにもリアルタイムで適応する、自己適応型大規模言語モデルフレームワークです。

プログラミング

•人工知能•大規模言語モデル

InternLM3-8B-Instruct — InternLM3-8B-Instructは、汎用目的と高度な推論を目的とした、80億パラメーターのオープンソース指令モデルです。

プログラミング

•大規模言語モデル•オープンソース