WizardMathモデル

マイクロソフトの全中国人研究者チームが開発したWizardMathモデルは、700億パラメーターのオープンソースの大規模言語モデルです。AIによって生成された指示を用いてファインチューニングされたこのモデルは、数学能力において、ChatGPT、Claude Instant 1、PaLM 2-540Bなどの他の大規模言語モデルを凌駕しています。

WizardMathモデルのオープンソースコードと論文はGitHubで公開されており、学術界や開発者から広く注目を集めています。このモデルは「Evil Instruction」技術を採用しており、様々な難易度レベルのオープンエンドな指示を自動生成することで、大規模言語モデルの処理能力を向上させています。研究チームは、この手法に基づき、コード生成に特化したWizardCoderなどの他の分野のモデルも開発しています。

この研究チームは、マイクロソフトアジアインターネットエンジニアリング研究所とMicrosoft Researchの研究者を含む、複数の中国人科学者で構成されています。