Glyph-ByT5-v2
多言語視覚テキストレンダリングのための強力な美学的基盤
一般製品生産性多言語視覚テキストレンダリング
Glyph-ByT5-v2は、マイクロソフトアジア研究院が開発した、高精度な多言語視覚テキストレンダリングのためのモデルです。10種類の言語に対応した正確な視覚テキストレンダリングを可能にするだけでなく、美的な品質も大幅に向上させています。本モデルは、高品質な多言語グリフテキストと平面デザインデータセットを作成し、多言語視覚段落ベンチマークを構築し、最新の歩容認識に基づく選好学習手法を用いて視覚美学の品質を高めています。