智譜AI、中文LLMアラインメント評価基準AlignBenchを発表

站长之家

公開日AIニュース · 1 分で読めます · Dec 12, 2023

265

AlignBench: 中国語大規模言語モデルのための評価基準

智譜 AIは、中国語大規模言語モデル（LLM）専用の評価基準AlignBenchを発表しました。これは中国語大規模モデル向けの初の評価基準であり、多角的な視点からモデルと人間の意図の一致度を精密に評価できます。

AlignBenchのデータセットは、実際の使用事例に基づいており、初期構築、機密性スクリーニング、模範解答の作成、難易度選別などの手順を経て、現実性と挑戦性を確保しています。データセットは、知識質問応答、文章生成、ロールプレイングなど、8つの主要なカテゴリに分類された多様な問題で構成されています。

自動化と再現性を確保するため、AlignBenchはGPT-4やCritiqueLLMなどの採点モデルを用いて、各モデルの回答にスコアを付け、回答の質を表しています。採点モデルは、多角的で、ルールに基づいて調整された採点方法を採用しており、モデルによる採点と人間の採点の一致性を向上させ、詳細な評価分析と評価スコアを提供します。

開発者はAlignBenchを使ってモデルを評価し、GPT-4やCritiqueLLMなどの高性能な採点モデルでスコアを付けることができます。AlignBenchウェブサイトを通じて結果を提出すると、CritiqueLLMを採点モデルとして使用して評価が行われ、約5分で評価結果を得ることができます。

智譜AIのオープンソース画像生成モデルCogView4、中国語と英語の両言語プロンプトに対応

智譜AIが最新のオープンソース画像生成モデルCogView4を発表しました。CogView4は、6億のパラメータ数を誇り、中国語入力と中国語テキストから画像への生成を全面的にサポートしており、画像の中に漢字を生成できる最初のオープンソースモデルとして注目されています。CogView4は、中国語と英語の両言語プロンプトに対応できる点が最大の特徴であり、特に複雑な中国語指示の理解と遵守に優れており、中国語コンテンツ制作者にとって朗報です。画像の中に漢字を生成できる最初のオープンソース画像生成モデルとして、オープンソース分野における大きな空白を埋めるものです。

智譜AI、10億円超える戦略的資金調達を完了

この資金調達は、国産基盤大規模言語モデルGLMの技術革新とエコシステムの発展を促進するために主に使用されます。国内で最も早く大規模言語モデルをオープンソース化したAI企業である智譜は、AI技術の普及に尽力してきました。今回の資金調達により、浙江省と長三角地域で急速に発展する経済主体へのサービス向上のため、技術開発とエコシステム構築への投資を拡大します。

AIニュース

智譜AI、中文LLMアラインメント評価基準AlignBenchを発表

站长之家

関連AIニュースの推奨

わずか4週間で！富士康、中国語大規模言語モデルFoxBrainを発表

智譜AIのオープンソース画像生成モデルCogView4、中国語と英語の両言語プロンプトに対応

智譜AI、10億円超える戦略的資金調達を完了

智譜AI、浙江省に智譜新篇科技有限公司を設立