DeepSeek、深夜に新たな多様な大規模言語モデルJanus-Proを発表

AIbase基地

公開日AIニュース · 1 分で読めます · Jan 28, 2025

922

中国発の大規模言語モデルDeepSeekが、新しいマルチモーダル大規模言語モデルJanus-Proを発表し、テキストから画像を生成する分野に正式参入しました。これはDeepSeekのマルチモーダルAI技術における大きな進歩を示しています。

GenEvalとDPG-Benchのベンチマークテストにおいて、Janus-Pro-7BはOpenAIのDALL-E3を凌駕し、Stable Diffusion、Emu3-Genなどの主要なモデルをも上回りました。Janus-ProはMITオープンソースライセンスを採用しているため、商業利用に制限はありません。DeepSeekによると、Janus-Proは2024年11月13日にリリースされたJanusFlow大規模言語モデルの上位版です。

DeepSeekが深夜に新しいマルチモーダル大規模言語モデルを発表 OpenAIを圧倒する性能

前世代のモデルと比較して、Janus-Proはトレーニング戦略の最適化、トレーニングデータの拡張、モデル規模の拡大を実現しました。これらの改善により、Janus-Proはマルチモーダル理解とテキストから画像への指示追従機能において大幅な進歩を遂げ、テキストから画像への生成の安定性も向上しました。

DeepSeekが深夜に新しいマルチモーダル大規模言語モデルを発表 OpenAIを圧倒する性能

Janus-Proは現在、384x384ピクセルの解像度の画像しか処理できませんが、コンパクトなモデルサイズを考慮すると、このレベルの性能は驚くべきものです。

マルチモーダルモデルとして、Janus-Proは画像の生成だけでなく、画像の説明、ランドマークの認識、画像内のテキストの認識、画像内の知識の紹介なども行うことができます。

重要なポイント：
🌟 DeepSeekがJanus-Proマルチモーダル大規模言語モデルを発表し、テキストから画像を生成する分野に進出。
📈 ベンチマークテストで、Janus-Pro-7BはOpenAIのDALL-E3などの主要なモデルを上回る性能を示しました。
✅ Janus-ProはMITオープンソースライセンスを採用しており、商業利用に制限はありません。

00後がDeepSeekライブコマースで1日で3.3億元を売り上げる

最近、浙江省杭州市で、AIツールDeepSeekの人気が高まるにつれ、多くの起業家がその強力な機能を活用して収益を上げ始めています。先日、00後のあるストリーマーがDeepSeekを使ってライブコマースを行い、わずか1日で3.3億元相当の商品を販売したというニュースが注目を集めています。報道によると、DeepSeekの助けを借りて、多くの企業や個人が新しい販売方法を試みています。例えば、義烏のある店主はDeepSeekを使って在庫を完売させました。

百度AI創作アプリ橙篇がDeepSeek-R1フルバージョンに正式対応

3月10日、百度文库傘下の橙篇アプリがDeepSeek-R1フルバージョンに正式対応し、ユーザーにより効率的で強力なAIアシスト機能を提供します。百度文库の膨大なコンテンツ蓄積とAI能力の蓄積を基盤とする橙篇は、今回のアップグレードにより、学習、生活、創作におけるユーザーの多様なニーズにより良く対応できるようになりました。

海外メディア：Manusは中国の第二のDeepSeekモーメントではない可能性

最近、Manusという中国のAIエージェントプラットフォームがオンラインで大きな注目を集めています。先週プレビュー版がリリースされて以来、急速に多くのユーザーを獲得しており、Hugging Faceのプロダクト責任者は「私が見た中で最も印象的なAIツール」と評しています。同時に、AI政策研究者のDean Ball氏も、Manusは「最も複雑なコンピューターAI」だと述べています。Manusの公式Discordサーバーはわずか数日で会員数を増やし…

AIニュース

DeepSeek、深夜に新たな多様な大規模言語モデルJanus-Proを発表

AIbase基地

関連AIニュースの推奨

00後がDeepSeekライブコマースで1日で3.3億元を売り上げる

百度AI創作アプリ橙篇がDeepSeek-R1フルバージョンに正式対応

海外メディア：Manusは中国の第二のDeepSeekモーメントではない可能性

QQ音楽がAI音楽ポッドキャストの革新的機能を発表：聞きながら理解し、インタラクトできる