AI製品ランキング

AI製品ランキング

グローバルAI製品の動向を検索

グローバルAI情報を検索して、AIの新しい機会を発見

ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル

タイプ :

ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル

2024-12-16 14:41:42.AIbase

Nexa AI、エッジデバイス向け高速音声言語モデルOmniAudio-2.6Bを発表

Nexa AIは先日、エッジデバイスの高効率展開ニーズに対応する、新しい音声言語モデルOmniAudio-2.6Bを発表しました。従来の自動音声認識（ASR）と言語モデルを別々に構成するアーキテクチャとは異なり、OmniAudio-2.6BはGemma-2-2b、Whisper Turbo、カスタムプロジェクターを統合フレームワークに統合しています。この設計により、従来システムの各コンポーネント間の接続による非効率性と遅延が解消され、特に計算リソースが限られている状況に最適です。

Nexa AI、エッジデバイス向け高速音声言語モデルOmniAudio-2.6Bを発表

2024-08-21 10:15:24.AIbase

バイトダンス自動音声認識モデルSeed-ASR、様々なアクセントや方言を聞き分けます！

バイトダンスが発表したSeed-ASRエンジンは、膨大なトレーニングデータを用いて、標準中国語、中国語13方言、7言語の高精度認識を実現し、言語間のコミュニケーションの利便性を大幅に向上させました。その最大の強みは優れたコンテキスト認識能力であり、過去の情報を活用して人名、地名、キーワードを正確に認識でき、特に特定の状況下では認識精度が向上します。日常会話、複雑な会議、複数人の会話、背景ノイズのある環境など、あらゆる状況下で正確に音声転写が可能です。また、様々な専門用語も認識できます。

バイトダンス自動音声認識モデルSeed-ASR、様々なアクセントや方言を聞き分けます！

2023-11-27 10:02:37.AIbase

アマゾン、100以上の言語に対応する新しいASRシステムを発表

アマゾンは、100以上の言語をカバーする次世代ASRシステムを発表しました。このシステムは、包括的な自動音声認識サービスを提供します。音声基本モデルの精度は20～50％向上し、電話音声などの難しい分野では30～70％向上しました。自動句読点挿入、カスタム語彙、自動言語識別、話者分離など、さまざまな機能をサポートしています。数多くの企業がAmazon Transcribeを利用して、オーディオコンテンツのインサイトを解き放ち、アクセシビリティと検出可能性を高めています。