ChiMed-GPT: 中国科学技術大学とIDEA研究院による医療分野向け大規模言語モデル

中国科学技術大学(中科大)とIDEA研究院の封神榜チームは共同で、ChiMed-GPTという中文医療分野向けの大規模言語モデルを開発しました。

このモデルは、封神榜チームが開発したZiya2-13Bモデルをベースに構築されており、130億個のパラメータを有します。徹底的な事前学習、教師あり微調整、そして人間のフィードバックによる強化学習を経て、医療テキスト処理のニーズを満たすように設計されています。

ChiMed-GPTは、医療情報抽出、質疑応答、対話生成などのタスクにおいて、同規模の他のオープンソースモデルを上回る性能を示しており、複数の指標においてGPT-3.5をも凌駕しています。

本モデルは、医療テキストデータの効率的な処理だけでなく、患者からの問い合わせに適切な回答を生成することも可能です。