日本のAIスタートアップ企業ELYZAが、MetaのLlama 2をベースとした70億パラメーターの日本語言語モデルを発表しました。その性能はGPT-3.5に匹敵すると言われています。
このモデルは、追加の事前学習と独自の事後学習によって、5段階評価で最高点を獲得しました。ELYZAは、他の言語のLLMの能力を日本語に導入することに成功し、日本語学習量を削減することでモデルを改良しました。
日本のAIスタートアップ企業ELYZAが、MetaのLlama 2をベースとした70億パラメーターの日本語言語モデルを発表しました。その性能はGPT-3.5に匹敵すると言われています。
このモデルは、追加の事前学習と独自の事後学習によって、5段階評価で最高点を獲得しました。ELYZAは、他の言語のLLMの能力を日本語に導入することに成功し、日本語学習量を削減することでモデルを改良しました。
人工知能技術の発展に伴い、ビデオ理解の重要性が増しています。この背景から生まれたVideoLLaMA 2プロジェクトは、ビデオの大規模言語モデルにおける時空間モデリングと音声理解能力の向上を目指しています。本プロジェクトは高度なマルチモーダル言語モデルであり、ユーザーによるビデオ内容の理解を支援します。
Googleが新しいオープンソースモデルシリーズ「Gemma」を発表GemmaとLlama 2、Mistralの比較Gemmaの設計原則と特徴Gemmaで使用されているGeGLU活性化関数の特徴
WhatsAppは、Llama 2を搭載したAIチャットボットをテスト段階でリリースしています。Meta社は、高度なLlama 2大規模言語モデルを採用し、自然でリアルな会話体験を開発しました。ユーザーはショートカットを使用して、統合されたAIチャットボットを起動し、タスクを実行できます。これにより、ユーザーはより便利なコミュニケーション体験を得ることができます。現時点では、少数のテストユーザーのみに機能が公開されており、今後数日以内に全面展開される予定です。
Metaは、特定のタスクにおいてGPT-3.5 TurboやClaude 2を上回る、次世代大規模言語モデルLlama 2を発表しました。2022年7月にリリースされたLlama 2は、70億、130億、700億パラメーターの3つの異なる規模のモデルを提供しています。Metaはデルと協力し、企業顧客がクラウドサービスだけでなく、オンプレミスでLlama 2モデルを展開できるよう支援しています。Llama 2モデルはオープンソースであり、研究および一部の商業利用に使用できます。Metaはすでにマイクロソフトやアマゾンと提携しています。