Googleは、全く新しいオープンソースモデルシリーズ「Gemma」を発表しました。Gemmaは、Llama 2やMistralと比べて優れた性能を示し、独特な設計原則を採用しています。GemmaはGeGLU活性化関数を用いており、パラメータ規模は大きめですが、他のオープンソースモデルに取って代わる可能性があり、その強力な潜在能力を示しています。
Googleは、全く新しいオープンソースモデルシリーズ「Gemma」を発表しました。Gemmaは、Llama 2やMistralと比べて優れた性能を示し、独特な設計原則を採用しています。GemmaはGeGLU活性化関数を用いており、パラメータ規模は大きめですが、他のオープンソースモデルに取って代わる可能性があり、その強力な潜在能力を示しています。
人工知能企業Mistral AIは本日、最新の文書認識モデルMistral OCRの正式リリースを発表しました。このモデルは「地表最強のOCR」と評されており、その卓越した性能と多機能性から、Xプラットフォーム上で活発な議論を巻き起こしています。Mistral OCRは、複雑なPDF、画像、表、数式、多言語文書からの正確なデータ抽出をサポートし、速度と正確性の両方においてGoogle Document AIやAzure OCRを凌駕しています。
先日、Googleは、PaliGemma2Mix と名付けられた、新たなビジョン言語モデル(VLM)を発表しました。このモデルは画像処理と自然言語処理の能力を融合し、視覚情報とテキスト入力の両方を理解し、必要に応じて対応する出力を生成することができます。これは、人工知能技術におけるマルチタスク処理の更なる進歩を示しています。PaliGemma2Mix は非常に強力な機能を備えており、画像記述、光学文字認識(OCR)などを統合しています。
AI分野において、Mistralが最近リリースしたAIアシスタントLe Chatが大きな注目を集めています。リリースからわずか2週間で、ダウンロード数は驚異の100万回を突破しました。この成果は、フランス国内での熱狂的な歓迎にとどまらず、iOSアプリストアの無料アプリダウンロードランキングでトップに躍り出ました。フランスのマクロン大統領も最近のテレビインタビューでLe Chatに言及し、Mistral製のこのアプリのダウンロードを国民に推奨していました。