AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

AIスタートアップArthur、オープンソースAIモデル評価ツールBenchを発表

站长之家

公開日AIニュース · 1 分で読めます · Aug 18, 2023

ArthurBench: 大規模言語モデルの性能評価ツール

ニューヨークの人工知能スタートアップ企業Arthurは、大規模言語モデルの性能を評価・比較するためのオープンソースツール「ArthurBench」をリリースしました。

ArthurBenchは、企業が特定のユースケースにおいて様々な言語モデルの性能をテストし、正確性、可読性、リスク回避などの指標を用いて比較することを支援します。

既に金融サービス企業、自動車メーカー、メディアプラットフォームなどの企業がArthurBenchを利用し、分析の迅速化とより正確な回答の提供を実現しています。

Arthur オープンソースツール大規模言語モデル

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

UIUCとGoogle、検索機能付き大規模言語モデルSearch-R1を発表　百度検索などを活用して問題解答

AI界に衝撃的な技術が登場！言語モデルが自らインターネットで情報収集する能力を習得しました！試験のスコアはなんと41％も向上し、推論と検索を同時に行う究極の形態を実現。今回は、このアカデミック界における「カンニング」的進化を徹底解説。読み終えたら、自分のAIにもインターネット接続を検討したくなること間違いなし！論文はこちら:https://arxiv.org/abs/2503.09516　コードはこちら:https://github.com/PeterGriffinJin/Search-R

Apr 21, 2025

Google、Gemma 3 QATモデルを発表：RTX 3090 1枚でも容易に実行可能

Googleは最近、Gemma3シリーズの新しいバージョンを発表し、多くのAI愛好家を興奮させました。リリースからわずか1ヶ月後、Googleはメモリ要求を大幅に削減しながらモデルの高品質を維持することを目的とした、量子化感知訓練（QAT）で最適化されたGemma3を発表しました。具体的には、QATで最適化されたGemma3 27Bモデルは、メモリ要求が54GBから14.1GBに大幅に削減され、NVIDIA RTX 3090で実行できるようになりました。

Apr 21, 2025

アリババ傘下アントグループと清華大学合同プロジェクト、科技進歩一等賞を受賞　大規模言語モデルの安全問題を克服

先日閉幕した第18回中国電子情報年会において、中国電子学会が2024年度科学技術賞受賞者リストを発表しました。その中で、清華大学、北京中関村実験室、アントグループが共同で開発したプロジェクト「高効率協調型インターネット動的行動セキュリティ信頼性確保技術と応用」が科技進歩一等賞を受賞しました。この成果は、最先端技術がセキュリティと信頼性分野において持つ巨大な可能性を示すだけでなく、ますます複雑化するネットワーク環境への対処に有効なソリューションを提供します。インターネットの普及に伴い、悪意のあるトラフィック攻撃や隠蔽された攻撃は増加の一途を辿っており、

Apr 21, 2025

IntelがオープンソースAI PlaygroundでArc GPUによるローカルAIモデル実行の新体験を提供

Intelは最近、ローカル生成AI用に設計されたAI Playgroundソフトウェアを正式にオープンソースとして公開したと発表しました。これはIntel Arc GPUユーザーに強力なAIモデル実行プラットフォームを提供します。AIbaseが知る限り、AI Playgroundは様々な画像、動画生成モデルと大規模言語モデル（LLMs）をサポートしており、ローカルの計算資源を最適化することで、AIアプリケーションのハードウェアの敷居を大幅に下げています。このプロジェクトはGitHubで公開されており、世界中の開発者やAI愛好家から注目を集めています。

Apr 21, 2025

マイクロソフトMarkItDown MCP：Word、ExcelなどをMarkdown形式に変換

Apr 21, 2025

Persona Engine：AI駆動型ツールでバーチャルキャラクターを現実世界へ

急速に発展するデジタル時代において、バーチャルキャラクターとインタラクティブな体験の融合はますますトレンドとなっています。Persona Engineは、Live2D、**大規模言語モデル（LLM）、自動音声認識（ASR）、テキスト音声変換（TTS）**、そして**リアルタイム音声クローン（RVC）**を統合したオールインワンツールキットとして登場し、生き生きとしたインタラクティブなデジタルキャラクターを作成するための完璧なソリューションを提供します。このエンジンは特にVTubingに最適です。

Apr 21, 2025

バイトダンスがオープンソースのChatTS-14Bを発表：ネイティブな理解と時間的推論

バイトダンスの研究チームは、時系列データの理解と推論のために設計された140億パラメーターの大規模言語モデル（LLM）、ChatTS-14Bのオープンソース化を発表しました。Apache2.0ライセンスで公開されたChatTS-14Bのオープンソース化は、AIコミュニティで大きな注目を集め、時系列分析と生成AIの組み合わせにおける大きな進歩とみなされています。ChatTS-14B：時系列のためのインテリジェントな対話エンジンChatTS-14BはQwen2.5-1をベースに...

Apr 21, 2025

医療AIスタートアップ「每因智能」、数千万円のシードラウンド資金調達を実施　精密な疾患リスク予測に注力

杭州を拠点とする医療AI企業である每因智能科技有限公司は、先日、数千万元規模のシードラウンド資金調達を発表しました。調達資金は、主力製品の研究開発と商業化に充当されます。今回の資金調達は卓源アジアなどの機関がリードインベストメントを行い、西湖政府直投基金も出資しています。每因智能は、人工知能技術を活用して疾患リスクを予測し、健康管理を推進することに注力しています。主力製品は、独自開発のDP-LLM大規模言語モデルをベースとしており、多様な医療データの処理をサポートし、個人の将来的な疾患リスクを数百種類にわたる疾患を網羅して正確に定量化します。

Apr 21, 2025

IntelがAI Playgroundをオープンソース化、Intel Arcグラフィックスカードで様々なAIモデルを使用可能に

Intelは、生成AIソフトウェア「AI Playground」の正式なオープンソース化を発表し、AIコミュニティから大きな注目を集めています。Intel Arc GPUと統合グラフィックスカード向けに最適化されたAIツールであるAI Playgroundは、「AIの中心」として記述されており、ローカルで動作するチャット型大規模言語モデル（LLM）や画像・動画生成機能をサポートしています。今回のオープンソース化は、Intelによる生成AI技術普及に向けた取り組みを示しています。

Apr 21, 2025

銀行のテクノロジー変革が加速、大規模言語モデルがコア業務に浸透

デジタル化における課題と圧力が銀行業界で増す中、多くの銀行が、単純なチャットボットの応用にとどまらず、大規模言語モデル技術をコア業務に統合し始めています。最新の決算データによると、国内の主要銀行の一部は、テクノロジー投資と大規模言語モデルの活用において顕著な進展を見せていますが、投資の二極化傾向も明らかになっています。钛媒体Appによる主要10行（6大国有銀行と数行の株式商業銀行を含む）の分析によると、6行でテクノロジー投資の縮小が見られました。例えば…

Apr 18, 2025

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

AIスタートアップArthur、オープンソースAIモデル評価ツールBenchを発表

站长之家

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

UIUCとGoogle、検索機能付き大規模言語モデルSearch-R1を発表 百度検索などを活用して問題解答

Google、Gemma 3 QATモデルを発表：RTX 3090 1枚でも容易に実行可能

アリババ傘下アントグループと清華大学合同プロジェクト、科技進歩一等賞を受賞 大規模言語モデルの安全問題を克服

IntelがオープンソースAI PlaygroundでArc GPUによるローカルAIモデル実行の新体験を提供

マイクロソフトMarkItDown MCP：Word、ExcelなどをMarkdown形式に変換

Persona Engine：AI駆動型ツールでバーチャルキャラクターを現実世界へ

バイトダンスがオープンソースのChatTS-14Bを発表：ネイティブな理解と時間的推論

医療AIスタートアップ「每因智能」、数千万円のシードラウンド資金調達を実施 精密な疾患リスク予測に注力

IntelがAI Playgroundをオープンソース化、Intel Arcグラフィックスカードで様々なAIモデルを使用可能に

銀行のテクノロジー変革が加速、大規模言語モデルがコア業務に浸透

UIUCとGoogle、検索機能付き大規模言語モデルSearch-R1を発表　百度検索などを活用して問題解答

アリババ傘下アントグループと清華大学合同プロジェクト、科技進歩一等賞を受賞　大規模言語モデルの安全問題を克服

医療AIスタートアップ「每因智能」、数千万円のシードラウンド資金調達を実施　精密な疾患リスク予測に注力