Tech星球の報道によると、アリババの通義实验室の音声チーム責任者であった鄢志杰(エン・シジェ)氏が2月15日に正式に退職しました。アリババのP序列体系におけるP10レベルの役職でした。
鄢志杰氏は、音声認識分野の専門家です。2003年に中国科学技術大学の音声研究所で博士課程に進学し、科大訊飛の創業者である王仁華教授に師事しました。2008年に博士号を取得後、マイクロソフトアジア研究所の音声チームで主任研究員として2015年まで勤務し、主に音声認識と音声合成の分野を研究していました。学術面では、多くのトップレベルの論文を発表し、複数の特許を取得しています。
画像出典:画像はAIによって生成され、画像ライセンスサービスプロバイダーMidjourneyから提供されています。
2015年にアリババに入社後、鄢志杰氏はIDSTスマート音声インタラクションチームのディレクターを務めました。2017年には、馬雲(ジャック・マー)氏が設立した達摩院の機械知能音声研究所の責任者となり、達摩院の最初の13人のコアメンバーの一人でした。2023年の大規模言語モデル時代が到来すると、鄢志杰氏はアリババ初の一般公開された大規模言語モデルアプリケーション「通義聴悟」の開発を主導しました。これは、音声とビデオコンテンツに特化したAIアシスタントです。2024年には、通義实验室の音声チーム責任者として公開イベントに出席しました。
現在、鄢志杰氏の今後の進路はまだ明らかになっていませんが、業界ではこの音声技術の専門家がAIスタートアップブームに参入する可能性が高いと予測されています。