【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツを提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、アリババインターナショナル、最新のマルチモーダル大規模言語モデルOvisを発表、料理の写真から調理手順を提供
アリババインターナショナルのAIチームは、マルチモーダル大規模言語モデルOvisを発表し、様々な業界に新たな機会をもたらしました。Ovisは強力な画像認識とデータ処理能力を備え、テキストや画像など様々なデータを処理でき、優れた総合的な能力を示しています。OpenCompassの評価で総合ランキング1位を獲得し、競合他社を凌駕しました。OvisはApache2.0オープンソースライセンスを採用しており、開発者は自由に使用および改良できます。
【AiBase要約:】
🌟 Ovisはマルチモーダル大規模言語モデルで、テキストや画像など様々なデータを処理し、総合的な能力を発揮します。
🚀 OvisはOpenCompassの評価で総合ランキング1位を獲得し、競合他社を凌駕しました。
🔓 OvisはApache2.0オープンソースライセンスを採用しており、モデルとコードはGitHubで公開され、開発者は自由に使用および改良できます。
2、画期的なAI対話システムMoshiが登場:機械も人間のように話せる?
デジタル時代において、Kyutai研究所が開発した全二重音声対話システムMoshiは、従来の音声対話システムを覆し、より自然でスムーズな人間と機械の対話体験を実現しています。Moshiは、テキスト言語モデル、ニューラルオーディオコーデック、マルチストリームオーディオ言語モデルを組み合わせることで、卓越した性能を発揮します。同時に、Moshiはセキュリティにも配慮し、有害なコンテンツを生成せず、ユーザーのプライバシーを保護します。これは、人間と機械のインタラクション方法における大きな革新であり、将来の対話システムの可能性を示しています。
【AiBase要約:】
🌟 Moshiは全二重音声対話システムで、対話を音声から音声への生成プロセスと捉え、従来の音声対話システムの問題点を解決しています。
🔑 Moshiの中核技術には、Heliumテキスト言語モデル、Mimiニューラルオーディオコーデック、マルチストリームオーディオ言語モデルが含まれ、会話における重なり、割り込み、挿入語の処理を実現しています。
💡 Moshiは心の声機能を備え、時間調整テキストトークンの予測により、音声生成の品質を高め、会話能力を向上させています。
詳細リンク:https://huggingface.co/kyutai/moshiko-pytorch-bf16
3、Apple Intelligenceテスト版が公開
アップルは、iOS18.1、iPadOS18.1、macOS Sequoia15.1の公開テスト版を発表しました。これには、テキスト書き換えツール、刷新されたSiriのデザイン、写真からオブジェクトを削除する「クリーンアップ」ツールなど、近日公開予定のApple Intelligence機能が含まれています。アップルのベータソフトウェアプログラムウェブサイトに登録してテスト資格を取得し、デバイスの設定でベータ版アップデートをダウンロードしてインストールできます。新機能は、iPhone15Pro、iPhone16、iPhone16Pro、M1チップ以降を搭載したiPadとMacなど、一部のデバイスのみに限定されます。
【AiBase要約:】
🔧 テキスト書き換えツール、新しいSiriのデザイン、写真のクリーンアップツールなどの機能が近日公開予定です。
📱 iPhone15Pro、iPhone16、iPhone16Pro、M1チップ以降を搭載したiPadとMacなど、一部のデバイスのみに限定されます。
📅 アップルは10月にiOS18.1、iPadOS18.1、macOS Sequoia15.1の正式版をリリースする予定です。正式版リリース後に新機能をご体験いただけます。
4、ロボット企業1Xがワールドモデルを発表
1X Technologiesが発表した新しい生成モデルは、ロボットシステムのトレーニングにおける効率性を向上させ、「ワールドモデル」の学習という重要な課題を解決しました。このモデルは、ロボットの動作が世界に与える影響を予測し、様々な未来のシナリオを生成し、複雑な物体の相互作用を予測します。
【AiBase要約:】
🌟 ワールドモデルは、ロボットの行動と環境の相互作用を予測できる仮想シミュレーターです。
🤖 リアルデータから学習することで、数百万ものシナリオで評価でき、ロボットの知能を向上させます。
💰 研究を促進するために、1Xワールドモデルチャレンジを開催し、賞金を提供しています。
5、アマゾン、生成AIツールを大量発表、ショッピング体験が大幅にアップグレード
アマゾンは最近、消費者とサードパーティセラーのショッピング体験を向上させることを目的とした、注目に値する一連の生成AIツールを発表しました。これには、パーソナライズされた製品推奨、無料のAIビデオ生成ツール、そしてチャットボット「アメリア」が含まれており、ユーザーとセラーに、より便利で効率的なショッピングとマーケティング体験を提供します。
【AiBase要約:】
🌟 パーソナライズされた製品推奨:顧客の検索履歴と購入履歴に基づいて、パーソナライズされた推奨を提供します。
🎥 無料AIビデオ生成ツール:セラーがビデオマーケティングの効果を高め、消費者のブランドビデオコンテンツのニーズを満たすお手伝いをします。
🤖 チャットボット「アメリア」は、パーソナライズされたアドバイスとビジネス分析を提供し、セラーがビジネス状況を把握するお手伝いをします。
6、OpenAI、最新のAIモデルo1を企業と教育分野に拡大
OpenAIは、複雑な推論タスクの処理向けに設計された最新のAIモデルo1-previewとo1-miniを発表し、企業と教育機関に新たな可能性をもたらしました。これらのモデルは、人間の思考プロセスをシミュレートすることで、複雑な問題を解決し、より厳密な思考方法を提供します。企業顧客は大きな飛躍を遂げ、AIを高リスク問題解決のパートナーとして見なすことができます。教育分野も恩恵を受け、学生や研究者は最先端のAIツールを利用して難しい問題を解決できます。o1モデルは強化されたセキュリティ機能を備え、顧客データの安全性を確保します。
【AiBase要約:】
🚀 o1-previewとo1-miniモデルは、複雑な推論タスクの処理向けに設計されており、人間の思考プロセスをシミュレートして、難しい問題を解決します。
💡 o1モデルは応答前により多くの時間を費やして情報を処理し、o1-previewは数学オリンピックで83%の問題を解決しました。
💻 o1-miniモデルはプログラミングタスク向けに設計されており、費用対効果の高い選択肢を提供し、複雑なコードの生成やデバッグなどのタスクに適しています。
7、OpenAI、新たな資金調達ラウンドで投資家に対し最低2.5億ドルの出資を要求と報道
OpenAIは巨額の資金調達ラウンドの最終段階の交渉を行っており、その評価額は1500億ドルに達する可能性があります。関係者によると、同社は投資家に対し最低2.5億ドルの出資を要求しています。これは、同社がこの資金調達ラウンドを非常に必要としていることを示しています。
【AiBase要約:】
🔍 OpenAIの評価額は1500億ドルに達する可能性があります。
💰 投資家は最低2.5億ドルの出資を行う必要があります。
🚀 新しい資金調達ラウンドはOpenAIに資金援助を提供します。
8、Instagram、AIを用いた新たな青少年アカウントの年齢確認を発表
Instagramは最近、人工知能技術を用いたユーザーの年齢確認を発表しました。これは、青少年ユーザーをより効果的に特定することを目的としており、ユーザーの安全とプライバシー保護の向上に繋がる見込みです。
【AiBase要約:】
🌟 InstagramがAIによる年齢確認を発表し、青少年ユーザーを特定します。
🔒 Yotiとの連携で年齢を確認し、虚偽申告ユーザーの96%がブロックされました。
🚨 AIの効果が不十分な場合は、政府が介入して強制措置を講じる可能性があります。
9、OpenAI、機械学習エンジニアを募集、マルチエージェント研究の新分野を開拓
OpenAIは最近、機械学習エンジニアの募集を発表し、マルチエージェント研究チームを設立することで、AIの推論能力の向上を目指しています。新しく発表されたo1モデルは、ユーザーが時間をかけて慣れる必要がありますが、科学と数学の分野で優れた成果を上げています。
【AiBase要約:】
🔍 OpenAIは機械学習エンジニアを募集し、新しいマルチエージェント研究チームを編成しています。
🚀 新しく発表されたo1モデルは、AIの推論能力を向上させることを目的としており、ユーザーは時間をかけて慣れる必要があります。
🏆 o1シリーズモデルは科学と数学の分野で優れた成果を上げており、複雑な問題解決能力が大幅に向上しています。
10、インテルAIアクセラレータGaudi3が来週発表、NVIDIAの支配的地位に挑戦!
インテルは、AIチップ市場におけるNVIDIAの支配的地位に挑戦することを目指したGaudi3 AIアクセラレータを発表間近です。このアクセラレータはAIヒーローと呼ばれ、高効率と高速演算能力を備え、NVIDIAのH100 GPUを凌駕すると予想されています。インテルは2024年の計画を着実に進めており、2025年に発表予定のFalcon Shoresは、AI分野における競争力をさらに高めるでしょう。
【AiBase要約:】
🌟 Gaudi3アクセラレータは高効率と高速演算能力を備え、NVIDIA H100 GPUを凌駕すると予想されています。
⚡️ インテルは、Gaudi3のエネルギー効率が前世代製品の2倍であると主張し、NVIDIAの支配的地位に挑戦します。
🚀 2025年を見据え、Falcon ShoresはAI能力と強力なGPUを組み合わせ、市場におけるインテルの競争優位性を高めます。