ja
AI製品ランキング
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
ホーム
AIニュース
AIデイリー
マネタイズガイド
AIチュートリアル
AIツールナビ
AI製品ライブラリ
ja
AI製品ランキング
グローバルAI製品の動向を検索
グローバルAI情報を検索して、AIの新しい機会を発見
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
タイプ :
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
2024-12-16 14:41:42
.
AIbase
.
14.0k
Nexa AI、エッジデバイス向け高速音声言語モデルOmniAudio-2.6Bを発表
Nexa AIは先日、エッジデバイスの高効率展開ニーズに対応する、新しい音声言語モデルOmniAudio-2.6Bを発表しました。従来の自動音声認識(ASR)と言語モデルを別々に構成するアーキテクチャとは異なり、OmniAudio-2.6BはGemma-2-2b、Whisper Turbo、カスタムプロジェクターを統合フレームワークに統合しています。この設計により、従来システムの各コンポーネント間の接続による非効率性と遅延が解消され、特に計算リソースが限られている状況に最適です。
2024-08-21 10:15:24
.
AIbase
.
11.2k
バイトダンス自動音声認識モデルSeed-ASR、様々なアクセントや方言を聞き分けます!
バイトダンスが発表したSeed-ASRエンジンは、膨大なトレーニングデータを用いて、標準中国語、中国語13方言、7言語の高精度認識を実現し、言語間のコミュニケーションの利便性を大幅に向上させました。その最大の強みは優れたコンテキスト認識能力であり、過去の情報を活用して人名、地名、キーワードを正確に認識でき、特に特定の状況下では認識精度が向上します。日常会話、複雑な会議、複数人の会話、背景ノイズのある環境など、あらゆる状況下で正確に音声転写が可能です。また、様々な専門用語も認識できます。
2023-11-27 10:02:37
.
AIbase
.
3.5k
アマゾン、100以上の言語に対応する新しいASRシステムを発表
アマゾンは、100以上の言語をカバーする次世代ASRシステムを発表しました。このシステムは、包括的な自動音声認識サービスを提供します。音声基本モデルの精度は20~50%向上し、電話音声などの難しい分野では30~70%向上しました。自動句読点挿入、カスタム語彙、自動言語識別、話者分離など、さまざまな機能をサポートしています。数多くの企業がAmazon Transcribeを利用して、オーディオコンテンツのインサイトを解き放ち、アクセシビリティと検出可能性を高めています。