マイクロソフト、最新のビジョン基盤モデルFlorence-2を発表　ブラウザ上でローカル実行

AIbase

公開日AIニュース · 1 分で読めます · Jun 27, 2024

672

最近、マイクロソフトが発表した最新のビジュアル基礎モデルFlorence-2が大きな進歩を遂げました。Transformers.js技術を活用することで、WebGPUに対応したブラウザ上で100％ローカル実行できるようになりました。この画期的な進歩により、AIビジュアルアプリケーションに革命的な変化がもたらされ、強力なビジュアル認識機能をリモートサーバーに依存することなく、ユーザーのブラウザ上で直接実現できるようになりました。

Florence-2-base-ftは、2.3億個のパラメータを持つビジュアル基礎モデルであり、プロンプトベースの方法を使用して幅広いビジュアルおよびビジュアル言語タスクを処理します。このモデルは、以下の機能をサポートしています（これらに限定されません）。

画像キャプション生成
光学文字認識（OCR）
物体検出
画像セグメンテーション

この強力なモデルはわずか340MBのストレージしか使用しません。一度ロードされるとブラウザにキャッシュされ、ユーザーがページに再度アクセスした際に再ダウンロードすることなく呼び出すことができます。最も驚くべき点は、このプロセス全体がユーザーのブラウザ上でローカルに行われ、サーバーにAPI呼び出しを送信する必要がないことです。つまり、モデルのロード後、インターネット接続が切断されても、ユーザーはすべての機能を引き続き使用できます。

Florence-2のローカル実行は、🤗 Transformers.jsとONNX Runtime Web技術によって実現されました。この画期的な進歩は、ユーザーのプライバシー保護レベルを高めるだけでなく、使用コストの大幅な削減にもつながり、AIビジュアル技術の普及に道を拓きます。

開発者や技術愛好家の皆様にとって、Florence-2のONNXモデルはHugging Faceプラットフォームで公開されています。詳細については、https://huggingface.co/models?library=transformers.js&other=florence2をご覧ください。また、プロジェクトのソースコードもGitHubで公開されており、https://github.com/xenova/transformers.js/tree/v3/examples/florence2-webgpuから取得して、さらなる調査や開発を行うことができます。

Florence-2のこの進歩は、AIビジュアルアプリケーションの急速な発展と普及を間違いなく促進するでしょう。近い将来、ブラウザベースのより多くのインテリジェントなビジュアルアプリケーションが私たちの日常生活や働き方を変えることを期待できます。

DeepSeek連携による企業微信、ワンクリックで7×24時間対応の企業向け「インテリジェントアシスタント」を実現

2月21日、企業微信の新バージョンが正式にリリースされ、インテリジェントロボット、インテリジェント表計算（顧客フォローアップサマリー）などのAI機能が正式にリリースされ、フルバージョンのDeepSeek-R1大規模モデルが段階的に導入されました。企業は内部ナレッジベースに基づいた専用の「インテリジェントアシスタント」をワンクリックで作成でき、顧客フォローアップ状況をワンクリックで自動的に要約することもできます。AIを活用することで、企業内での協業と顧客サービスの効率を大幅に向上させることができます。DeepSeek連携によるインテリジェントロボット：開発不要で企業専用の「万能アシスタント」を作成今回のアップデートでは、企業微信で「インテリジェント」が全面的にリリースされました。

微信検索がDeepSeek大規模言語モデルに対応、AIは朋友圈のチャット情報などを利用しないと発表

先日、微信は検索機能にDeepSeek-R1モデルを導入したことを発表しました。現在、段階的に導入するグレーテスト段階にあります。一部のユーザーは微信の検索ボックスでAI検索を選択すると、DeepSeek-R1が提供する高度な思考機能を体験できます。微信側は、大規模言語モデルの導入によって検索の知能化と精度向上を目指し、ユーザーの検索意図をより適切に理解し、複雑な検索クエリを分析処理することを目指していると述べています。現在、微信検索は混元、DeepSeekなど複数のLLMを導入し、ユーザーエクスペリエンスの向上を図っています。データソースについては、

微信AI検索機能、アクセス集中でチャットボット「元宝」へ転換

先日、テンセント社が自社のソーシャルプラットフォームWeChatで発表したAI検索機能が、グレーテスト開始から1日も経たずにサーバー負荷過多により正常に使用できなくなりました。テンセントの説明によると、この機能は混元大モデルを利用した検索で、DeepSeek-R1モデルを導入してより深い思考サービスを提供しています。しかし、グレーテスト参加ユーザー数が極めて少ないにもかかわらず、呼び出し量が異常に膨大で、システムは頻繁に「サービスが混み合っています。しばらくしてからもう一度お試しください」というメッセージを表示しました。この状況下、テンセントは迅速に措置を講じざるを得ませんでした。