天眼查アプリによると、騰訊科技(深セン)有限公司は最近、「大規模言語モデルの訓練方法、装置、計算機設備および記憶媒体」という名称の特許を申請しました。この特許の要約は、この方法が第1要約テキストと第2要約テキストを導入することで、大規模言語モデルの訓練過程においてモデルにより多くの学習可能な情報を提供することを明らかにしています。
特許の説明によると、第1要約テキストと第2要約テキストは情報量に違いがあり、第1要約テキストには正しい文と間違った文が含まれています。同一テキストのこれら2つの異なる要約を比較学習し、正しい文と間違った文を区別することで、要約テキストが単一であることによって起こりうるモデルの過学習や不正確な生成などの問題を効果的に回避できます。
この方法の革新的な点は、モデルの汎化性能を高め、モデルの精度を効果的に向上させることです。多様な要約テキストの内容を導入することで、騰訊のこの訓練方法は、大規模言語モデルの訓練過程により効率的で正確な向上をもたらします。