AI日報：GPT-4oを凌駕する性能！Metaの4050億パラメーターのオープンソースモデルLlama 3.1が流出；Stability AIがオーディオ生成モデルStable Audio Openをオープンソース化

【AI日報】へようこそ！ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットな話題をお届けし、開発者に焦点を当て、技術トレンドの洞察や革新的なAI製品の応用について理解を深めるお手伝いをします。

最新のAI製品詳細はこちら：https://top.aibase.com/

1、AI業界を震撼！Llama 3.1リーク：4050億パラメーターのオープンソース巨獣襲来！

Llama 3.1がリークされました！4050億パラメーターを誇るこのオープンソースモデルは、Reddit上で大きな波紋を広げています。正式リリース前にも関わらず、コミュニティで大きな話題となっています。Llama 3.1はGPT-4oを凌駕し、オープンソースモデルにおけるSOTAとなりました。多言語に対応し、豊富なトレーニングデータを使用し、セキュリティにも配慮しています。

【AiBase要約:】
🔥 Llama 3.1リーク、4050億パラメーター、GPT-4oを凌駕、SOTAに。
💡 英語、フランス語、ドイツ語など、多言語に対応し、多言語での会話で優れた性能を発揮。
🛡️ 開発チームはセキュリティに重点を置き、多角的なデータ収集方法を採用し、境界プロンプトと敵対的プロンプトを導入。
モデルカード出典：https://pastebin.com/9jGkYbXY#google_vignette

2、Luma AIが「Loops」機能を発表：ユーザーが無限ループビデオを簡単に作成可能に

Luma AIが新たに発表した「Loops」機能は、コンテンツクリエイターやデジタルマーケターに無限の創作の可能性をもたらします。簡単な操作でシームレスで連続したビデオループを作成でき、制作効率の向上、視聴者の注意を引きつけ、同時に制作時間とコストを削減できます。

【AiBase要約:】
🌟 テキストの説明、画像、またはキーフレームを使用して、無限ループのビデオを作成できます。
🎥 「Loops」機能は、AI生成ビデオの不連続性を解決し、コンテンツクリエイターが魅力的な作品をより簡単に制作できるようにします。
🔍 Luma AIは責任あるAI開発を約束し、コンテンツの透明性を確保するために、透かしと帰属システムの実装を計画しています。

3、Stability AIがオープンソースの音声生成モデルStable Audio Openを発表

Stability AIチームは、オープンソースの音声生成モデルStable Audio Openを発表しました。最長47秒、44.1kHzステレオオーディオを生成できます。オープンウェイト設計を採用し、合法的なオーディオデータを使用してトレーニングされており、データの倫理性を保証しています。高度な技術アーキテクチャを採用し、高忠実度で多様なオーディオを生成します。性能評価では、業界トップレベルのモデルと匹敵する、高品質なオーディオ生成能力を備えていることが示されています。

【AiBase要約:】
🎧 Stable Audio Openは、最長47秒、44.1kHzステレオオーディオの生成に対応。
📝 モデルのトレーニングには、Creative Commonsライセンスのオーディオデータのみを使用し、データの合法性と倫理性を確保。
🔍 Stable Audio Openの音声生成品質は検証済みで、高忠実度と多様性を備えています。
詳細リンク:https://top.aibase.com/tool/stable-audio-open-demo

4、トマト小説のAIトレーニング契約がネット小説作家から強い反発を招く

この記事では、トマト小説プラットフォームが引き起こした人工知能と著作権の争いを考察します。ネット小説作家はAIトレーニング補足契約に強く反対しており、AI技術の発展が人間のクリエイターの生存空間を圧迫することを懸念しています。AIの文学創作分野への応用については、賛成派と反対派に分かれており、創作効率とオリジナル作品価値に関する議論が巻き起こっています。

【AiBase要約:】
🤖 AIトレーニング補足契約がネット小説作家から強い反発を招き、著作権侵害の疑いがあり、潜在的な脅威となっています。
💡 AIの文学創作分野への応用は広く議論されており、賛成派は創作効率の向上を主張する一方、反対派はオリジナル作品価値の希釈を懸念しています。
⚖️ プラットフォームに対し、AI技術の応用と著作権の両方を考慮し、合理的な利益配分メカニズムを構築し、ネット文学創作の健全な発展を維持するよう求めています。

5、百度健康がインテリジェント体ファミリーを発表、霊医オープンプラットフォームなど5つの大規模モデルアプリケーションを発表

百度健康は2024年の産業生態会議で、医療業界の「不可能な三角形」問題を解決し、医療サービスのアクセシビリティ、手頃な価格、品質を向上させることを目的とした一連の大規模モデルアプリケーション製品を発表しました。AI技術を通じて、百度健康は医師と患者がより効率的に医療資源を取得し利用できるように支援します。

【AiBase要約:】
👩‍⚕️ 百度健康は健康インテリジェント体ファミリーを発表し、AIによる精密な医師検索、AIによる医学レポートの解釈、AIによる薬剤アシスタントなどのサービスを提供し、マルチモーダルインタラクションをサポート。
💻 オンライン医療コパイロットは、医師と患者向けにオンライン医療サービスを提供。
⚕️ CDSSは、基層医療機関の診断治療能力を高め、誤診や見落としを減らし、4000以上の基層医療機関で導入済み。

6、百度スマートクラウドが金融インテリジェント体アプリケーション「智金」を発表

百度スマートクラウドは金融インテリジェント体アプリケーション「智金」を発表しました。AI大規模モデル技術と金融業界のコアビジネスシナリオを深く融合することで、金融機関の業務効率と収益の向上を目指しています。智金アプリケーションは、ウェルス・マネジメント、資産評価、業務コンプライアンス、店頭取引など4つのコアシナリオを網羅し、インテリジェントで効率的な業務支援ツールを提供します。

【AiBase要約:】
🔍 ウェルス智顧：金融資産運用アドバイザーのスーパーアシスタントを提供。7×24時間体制で専門的な製品に関する相談とインテリジェントな推奨サービスを提供し、正確なマーケティングを支援。
📊 アセット智評：大規模モデルの能力を活用して大量の情報の収集、加工、整理を行い、金融アナリストが市場分析、投資戦略などの調査レポートを作成するのを支援。
⚖️ コンプライアンス智判：インテリジェントで高可用性のコンプライアンス管理ツールを提供し、金融業務のコンプライアンスリスクを軽減。
詳細リンク:https://top.aibase.com/tool/baiduzhijin-jinrongzhinengti

7、マスク氏が世界最強のAIトレーニングクラスタの正式稼働を発表

マスク氏は、xAIがメンフィス・スーパーコンピューティング・クラスタで世界最強のAIトレーニングを実施し、10万台のNvidia H100 GPUを搭載していると発表しました。この動きはメディアの注目を集めていますが、マスク氏のプロジェクトの進捗に対する懸念も寄せられています。同時に、xAIは競合他社からのプレッシャーに直面しており、競争力を維持するために革新的なモデルを発表する必要があります。

【AiBase要約:】
🌟 xAIが世界最強のAIトレーニングクラスタを稼働開始、10万台のNvidia H100 GPUを搭載。
⚡ マスク氏は2024年12月までに「最強のAI」をトレーニングする計画で、クラスタは大きな優位性をもたらす見込み。
🚀 xAIはOpenAI、Googleなどの競合他社からのプレッシャーに直面しており、競争力を維持するために革新的なモデルを発表する必要がある。

8、LensGo AIがFaceSync機能を発表、あなたの声と口の動きをターゲット画像に転送可能に

LensGo AIが発表した新しい機能FaceSyncは、ユーザーのパフォーマンスビデオと選択した画像またはビデオを同期させ、まったく新しい視覚体験を生み出します。ユーザーは自由に自分を表現し、どんなキャラクターにもなり、どんなストーリーでも語ることができ、創造性はイメージに制限されません。FaceSync機能はまだテスト段階であり、LensGo AIは安定性と表現力を確保するために継続的に最適化しています。

【AiBase要約:】
✨ ユーザーはパフォーマンスビデオを録画し、選択した画像またはビデオと同期させて、新しい視覚体験を生み出すことができます。
🎭 FaceSyncはユーザーの顔の表情、声、口の動きを正確に捉え、ターゲット画像またはビデオにマッピングします。
🚀 FaceSync機能はテスト段階であり、LensGo AIはユーザーの期待と専門的な基準を満たすために継続的に最適化しています。

9、写真1枚から3Dモデル作成がわずか30秒！Aiuni AI：Unique 3Dオープンソースベースのプロジェクト

デジタル時代において、Aiuni AIはUnique3Dオープンソースプロジェクトに基づき、任意のRGB画像から高忠実度の3Dモデルを生成するという目標を達成しました。そのコア技術であるUnique3Dは、深層学習と拡散モデルを活用することで、3Dモデリングの効率を向上させています。今後、Aiuni AIは仮想現実、拡張現実などへの応用分野の拡大を計画しており、様々な業界にさらなる可能性をもたらします。

【AiBase要約:】
🌟 高忠実度：Unique3Dで生成された3Dモデルは精度が高く、実物と一致しています。
⏱️ 高効率：入力画像から3Dモデルの作成までわずか30秒で、効率が大幅に向上。
🌐 強力な汎化能力：Unique3Dは様々な入力画像を処理し、高品質の3Dモデルを生成できます。
詳細リンク:https://top.aibase.com/tool/aiuni

10、米国の輸出規制に適合した新型AIチップにより、NVIDIAの株価が大幅上昇

NVIDIA社の株価は月曜日の早朝に大幅に上昇しました。これは、間もなく発売される新型Blackwellチップの中国市場向けバージョンが米国の輸出規制の要件を満たすというニュースが主な要因です。市場では、NVIDIAが輸出規制の課題にうまく対応したという信頼感が高まり、株価は好調な動きを見せています。同社の株価は技術革新と市場需要において顕著な成果を上げており、良好な発展の勢いを見せています。

【AiBase要約:】
📈 NVIDIAの株価は月曜日の早朝に大幅上昇し、新型Blackwellチップが米国の輸出規制の要件を満たすというニュースが影響。
💡 NVIDIAは中国の技術企業であるInspurと協力して、輸出規制の要件を満たす「B20」チップを生産する計画で、2025年第2四半期の出荷を予定。
🚀 Blackwellプラットフォームへの需要が強いことから、NVIDIAの株価は年初来で2倍以上上昇しており、月曜日の株価は4％以上上昇して122.76ドルに。

11、Cohereが5.5億ドルの資金調達を実施、評価額は55億ドルに

CohereはAIGCを主力とする著名な大規模言語モデルプラットフォームであり、最近5.5億ドルのシリーズD資金調達を成功させ、評価額は55億ドルに達しました。これは、市場における同社の強力なパフォーマンスと将来性ある見通しを示しています。

【AiBase要約:】
🌟 主要投資家はカナダ年金投資管理会社PSP Investmentsで、シスコ、日本の富士通、AMDベンチャーキャピタルなど多くの著名な機関も投資に参加しており、市場におけるCohereへの承認と支持を示しています。
🚀 創設チームにはAidan Gomez、Ivan Zhang、Nick Frosstが含まれ、全員がGoogle BrainとCortexで勤務経験があり、技術力は高く、背景も深いことから、同社の発展の基盤となっています。
📝 Cohereは、大規模言語モデルのカスタマイズ、意味検索、テキストによるクリエイティブライティング、長文の要約などの機能を提供する様々な企業向けサービスを提供し、企業の業務効率の向上とコスト削減に貢献しています。

12、GoogleのAI天気モデルNeuralGCMが新たなブレークスルー：計算効率が他のモデルの10万倍

Googleが最近開発したNeuralGCM大気大循環モデルは、天気予報分野で驚くべきブレークスルーを達成しました。計算効率は従来の物理モデルの10万倍に達し、30秒で22日間の天気をシミュレートできます。機械学習と物理モデリングを組み合わせることで、シミュレーションの精度が向上し、その成果は「Nature」誌に掲載され、注目を集めています。科学者たちに新たな気候変動予測ツールを提供し、気候変動研究にとって重要な意味を持っています。

【AiBase要約:】
🌍 驚異的な計算効率：NeuralGCMモデルは従来の物理モデルの10万倍の効率で、高速かつ高精度。
📈 天気予報の精度が既存モデルを上回る：2～15日間の予報精度が優れている。
💻 計算コストが極めて低い：NeuralGCMは一般的なコンピューターで効率的に動作し、従来のモデルより10万倍低い。
詳細リンク:https://t.co/zyXhW8deko