Starling-7B

LLM の可用性と安全性を向上

一般製品チャット言語モデル強化学習

Starling-7Bは、AIからのフィードバックによる強化学習（RLAIF）によって訓練された、オープンソースの大規模言語モデル（LLM）です。GPT-4による新しいトークンランキングデータセット「Nectar」と、新しい報酬訓練と方策調整プロセスを活用することで、その能力を最大限に発揮しています。Starling-7Bは、GPT-4を評価者として用いたMT Benchにおいて8.09点を獲得し、OpenAIのGPT-4とGPT-4 Turboを除く、現存するすべてのモデルを上回っています。ランキングデータセット「Nectar」、報酬モデル「Starling-RM-7B-alpha」、言語モデル「Starling-LM-7B-alpha」をHugging Faceで公開しており、LMSYS Chatbot Arenaでオンラインデモも提供しています。詳細な情報については、近日公開予定のコードと論文をご覧ください。

Best AI Websites & Tools

Starling-7B

Starling-7B 代替品

Starling-7B — LLM の可用性と安全性を向上

AlphaMaze — AlphaMazeは、視覚推論タスクに特化したデコーダー言語モデルであり、従来の言語モデルが視覚タスクで抱える課題を解決することを目指しています。

DeepSeek-R1-Distill-Llama-8B — DeepSeek-R1-Distill-Llama-8Bは、テキスト生成と推論タスクに適した高性能なオープンソース言語モデルです。

Eurus-2-7B-PRIME — PRIME手法を用いて訓練された70億パラメーターの言語モデルで、推論能力の向上を目的として設計されています。

Tülu 3 — オープンソースの先進的な言語モデルファインチューニングフレームワーク

Chat With Your Docs — ドキュメントと自然言語で会話できるPythonアプリケーション

Grok-2 — 最先端推論能力を備えた、最新の言語モデルです。

Meta-Llama-3.1-8B-Instruct — 多言語対話生成モデル

LMSYS チャットボットアリーナ — 様々な言語モデルのパフォーマンスを比較するオンラインチャットボット競技場です。

Stable LM 2 1.6B — 1.6億パラメーターの小型多言語安定型言語モデル

TOFU — TOFUデータセットは、大規模言語モデルの虚偽の忘却タスクのためのベンチマークを提供します。

WikiChat — Wikipedia データを用いて、大規模言語モデルの幻覚を抑制します。

Eureka — 人間レベルの報酬設計アルゴリズム。大規模言語モデルを用いて実装されています。

SymeChat — クラウド型AIチャットボットサービス

TalkGPT — 高度知的な言語モデルによるインタラクティブな対話

NotaGen — NotaGen は、大規模言語モデルのトレーニングパラダイムを採用し、高品質のクラシック音楽楽譜の生成に特化した、記号音楽生成モデルです。

Inception Labs — Inception Labsは、次世代の拡散型大規模言語モデルを発表し、極めて高速で効率的で高品質な言語生成能力を提供します。

OpenManus — OpenManusは、招待コードなしで使用できるオープンソースのインテリジェントエージェントプロジェクトです。

Instella — Instellaは、AMDが開発した高性能なオープンソース言語モデルであり、オープンソース言語モデルの発展を加速するために設計されています。

GPT-4.5 — OpenAIが発表した最新の言語モデルGPT-4.5は、教師なし学習能力の向上に重点を置き、より自然なインタラクション体験を提供します。

Gemini 2.0 Flash-Lite — Gemini 2.0 Flash-Liteは、長文処理と多様なアプリケーションシナリオ向けに最適化された、高効率な言語モデルです。

SWE-RL — 強化学習により、オープンソースソフトウェアの進化における大規模言語モデルの推論能力を向上させます。

Phi-4-mini-instruct — Phi-4-mini-instructは、高品質な推論集約型データに特化した軽量のオープンソース言語モデルです。

MLGym — MLGymは、AI研究エージェントの発展を促進するための新しいフレームワークとベンチマークです。

DeepSeek 日本語版 — DeepSeekは、論理推論、数学、プログラミングタスクに秀でた高度なAI言語モデルです。無料で利用できます。

AlphaMaze-v0.2-1.5B — 大規模言語モデルの視覚推論能力を向上させるための、テキスト迷路解決タスクを用いた革新的な手法

VLM-R1 — VLM-R1は、安定性と汎用性に優れた強化学習に基づくビジュアル言語モデルであり、画像理解タスクに特化しています。

NovaSky — NovaSkyは、コード生成と推論モデル最適化に特化したAI技術プラットフォームです。

Smithery — Model Context Protocolサーバーを使用して、言語モデルの機能を拡張します。