ja
AI製品ランキング
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
ホーム
AIニュース
AIデイリー
マネタイズガイド
AIチュートリアル
AIツールナビ
AI製品ライブラリ
ja
AI製品ランキング
グローバルAI製品の動向を検索
グローバルAI情報を検索して、AIの新しい機会を発見
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
タイプ :
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
2024-10-15 10:28:31
.
AIbase
.
12.4k
OCR 2.0モデル登場!グラフ、幾何学図形、楽譜も編集可能なテキストに変換
最近、研究者らが、GOT(汎用OCR理論)と呼ばれる新しい汎用光学文字認識(OCR)モデルを開発しました。彼らの論文では、「OCR2.0」という概念が初めて提案されており、この新しいモデルは、従来のOCRシステムの長所と大規模言語モデルの強力な機能を組み合わせることを目指しています。GOTのアーキテクチャは非常に高度で、約8000万パラメータの画像エンコーダと500万パラメータのデコーダが含まれています。画像エンコーダは、1024x1024ピクセルの画像を処理できます。
2024-09-18 10:04:59
.
AIbase
.
11.8k
普通のテキスト認識はもう時代遅れ!GOT-OCR2.0は数式や楽譜にも対応
最近、GOT-OCR2.0というエンドツーエンドOCRモデルが業界で大きな注目を集めています。このモデルは、通常のテキスト認識タスクだけでなく、数式、表、楽譜などの複雑なコンテンツにも対応でき、OCR分野の万能選手と言えるでしょう。GOT-OCR2.0の最大の強みはその多様な機能と優れた性能です。まず、このモデルは主に中国語と英語の文字認識をサポートしており、さらに微調整することで、より多くの言語に対応できるようになります。この言語対応力により、GOT-OCR2.0は国際的なアプリケーションに最適です