【AI日報】へようこそ!ここは、あなたが毎日人工知能の世界を探求するためのガイドです。毎日、AI分野のホットな話題を提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、Kimiがマルチファンクション音声通話モードを発表 音声変更や速度調整に対応
Kimi人工知能アシスタントは最近、待望の音声通話機能を発表し、ユーザーに豊かなインタラクティブ体験を提供しました。この新機能は、多様なアプリケーションとパーソナライズされた体験を兼ね備え、コミュニケーション効率の向上と個々のニーズへの対応を実現します。英語の練習や模擬面接など、特定のシナリオに特化した機能を強化し、学習や職場で革新的なソリューションを提供します。音声クローン技術の導入により面白さも加わり、ユーザーからのフィードバックを継続的に監視し、音声サービスの適用範囲を最適化して拡大していきます。
【AiBase要約:】
🌟 Kimiアシスタントの音声通話機能がアップデートされ、ユーザーのインタラクション体験が向上。
🎤リアルタイム字幕と調整可能な音声に対応し、より自然なインタラクションを実現。
🤖音声クローン技術を導入し、面白さと適用シナリオの幅を広げました。
2、智譜CogView3-Plusモデルがオープンソース化 テキストから画像生成技術が新たな時代へ
智譜テクノロジーチームは、CogView3とそのアップグレード版であるCogView3-Plus-3Bを発表し、AI支援によるアート制作が新たな段階に入ったことを示しました。CogView3のパフォーマンスは驚異的で、SDXLを77%上回り、推論速度はSDXLの10分の1です。CogView3-PlusはDiTフレームワークとテキスト-画像のジョイントアテンションメカニズムを導入し、パフォーマンスの向上とコスト削減を実現しました。オープンソースリポジトリが公開され、AI画像生成分野の急速な発展を促進し、テキストから画像生成技術の応用は広大な可能性を秘めています。
【AiBase要約:】
🚀 CogView3とCogView3-Plus-3Bがオープンソース化され、AI支援によるアート制作の新たな段階を示しました。
💡 CogView3のパフォーマンスは驚異的で、SDXLを77%上回り、推論速度はSDXLの10分の1です。
💻 CogView3-PlusはDiTフレームワークとテキスト-画像のジョイントアテンションメカニズムを導入し、パフォーマンス向上とコスト削減を実現しました。
詳細リンク:https://top.aibase.com/tool/cogview3Plus
3、AdobeがFirefly AIビデオモデルを発表、Photoshopに複数のAI機能を追加
Adobeは最新のMAXカンファレンスで、Firefly AIビデオモデルと複数の強化されたPhotoshopツールを発表し、ユーザーにエキサイティングなAIの新機能を提供しました。Fireflyビデオモデルにより、ユーザーはテキストプロンプトを使用してビデオコンテンツを作成または変更でき、クリエイターに全く新しい創作空間を提供します。同時に、削除ツールや生成フィル機能などのPhotoshopの新規AIツールにより、ユーザーはより簡単に画像を編集できます。Adobeは、ライセンスのあるコンテンツのみを使用してモデルをトレーニングし、コンテンツ証明書を導入して透明性を高めると約束しています。
【AiBase要約:】
📹 Firefly AIビデオモデルにより、ユーザーはテキストを使用してビデオコンテンツを作成および変更でき、クリエイターに新しい創作空間を提供します。
🖼️ Photoshopに削除ツールや生成フィルなどの複数のAIツールが追加され、ユーザーはより簡単に画像を編集できます。
🔍 Adobeは、ライセンスのあるコンテンツのみを使用してモデルをトレーニングし、コンテンツ証明書を導入して透明性を高めると約束しています。
詳細リンク:https://blog.adobe.com/en/publish/2024/09/11/bringing-gen-ai-to-video-adobe-firefly-video-model-coming-soon
4、ChatGPTが大幅進化:新インターフェースに検索機能を追加
OpenAIは最近、ChatGPTに大きなアップデートを行い、単なる会話アシスタントから包括的な情報プラットフォームへと変貌させました。インターフェースの更新には、新しく追加されたCanvas機能と移動可能なプロンプトボックスが含まれており、ユーザーエクスペリエンスが向上しています。導入されたSearchGPT機能により、ユーザーはリアルタイムのWebデータにアクセスでき、著名な出版社との連携により情報の信頼性を確保しています。
【AiBase要約:】
🔍 新しいインターフェースデザイン:Canvas機能と移動可能なプロンプトボックスを追加し、ユーザーエクスペリエンスを向上。
🌐 SearchGPT機能の導入:/キーを押してアクティブ化し、リアルタイムのWebデータにアクセス。インライン引用とリンク付き。
💡 使いやすさ:直感的な操作で、質問後数秒で出典付きの回答を提供。さらに質問して話題を掘り下げることができます。
5、火山引擎が巨大言語モデルのトレーニング用ビデオ前処理ソリューションを発表
火山引擎は最近のビデオクラウドテクノロジーカンファレンスで、大規模言語モデルのトレーニング用ビデオ前処理ソリューションを発表しました。この技術は既に豆包ビデオ生成モデルに成功裏に適用されており、AIビデオ生成技術の大きな進歩を示しています。
【AiBase要約:】
🔑 AIGCとマルチモーダル技術がユーザーエクスペリエンスを大きく変えています。
🔑 火山引擎はAI大規模言語モデルとビデオ技術の融合を探求し、包括的なソリューションを提供しています。
🔑 火山引擎が開発した前処理ソリューションは、アルゴリズムとエンジニアリングの面で最適化され、モデルトレーニングの効率を向上させています。
6、Midjourneyがオンラインエディターを間もなくリリース、V7バージョンとパーソナライズ機能も準備中
Midjourneyは最近、一連のエキサイティングなアップデートと間もなくリリースされる新機能を発表し、AI画像生成分野における同社の急速な発展と革新を示しました。チームは複数のプロジェクトを積極的に推進しており、新製品の急なリリースよりも、品質の向上とコア機能の開発に重点を置いています。
【AiBase要約:】
🚀 Midjourneyは新しいオンラインエディターを間もなくリリースします。ユーザーは画像をインポートし、深度マップと画像修復機能を使用して編集できます。
💡 チームは、新機能と既存の画像機能を区別するためにユーザーインターフェースを最適化しており、最初のリリース時にどの機能を含めるかについて検討しています。
🔧 Midjourneyは、ユーザーが複数のパーソナライズされた設定をより簡単に管理および切り替えることができる新しいツールを開発しており、より詳細なスタイルのパーソナライゼーションシステムを導入しています。
7、マイクロソフトがAIコンパニオンを開発中 ユーザーの行動を「見て」そして「覚える」
最近、マイクロソフトはユーザーの行動をリアルタイムで観察できるAIコンパニオンの開発に注力しており、深いインタラクティブな関係を構築することを目指しています。これは、人間が語りかけ、理解し、寄り添うという基本的なニーズを反映しています。同時に、Windowsの新機能であるRecallはユーザーのデジタル履歴を深く掘り下げ、過去の経験を再現します。ZoomはAIクローン機能を発表し、ユーザーは自分のデジタル版を会議に派遣して、作業効率を向上させることができます。
【AiBase要約:】
🌟 マイクロソフトは、ユーザーの行動をリアルタイムで観察できるAIコンパニオンを開発しており、深いインタラクティブな関係を構築することを目指しています。
📂 Windowsの新機能であるRecallは、ユーザーのデジタル履歴を深く掘り下げ、過去の経験を再現します。
💬 ZoomはAIクローン機能を発表し、ユーザーは自分のデジタル版を会議に派遣して、作業効率を向上させることができます。
8、マイクロソフトのAI副社長がOpenAIに移籍 AGI研究に注力
マイクロソフトのAI副社長であるセバスチャン・ブベック氏がマイクロソフトを退社し、OpenAIに入社し、人工汎用知能(AGI)の研究に注力します。この変化は、ブベック氏のキャリアにおける転換点であり、OpenAIの発展にも強力な支援をもたらします。
【AiBase要約:】
🧠 ブベック氏はマイクロソフトを退社し、OpenAIに入社し、AGI研究に注力します。
🤝 マイクロソフトとOpenAIの関係は複雑で、投資家でありながら競合相手でもあります。両社は今後も協力していくことを望んでいます。
🚀 ブベック氏の加入は、OpenAIが小型言語モデルとAGI研究においてブレークスルーを達成する原動力となるでしょう。
9、驚異的!AIモデルDIAMONDが『カウンターストライク』をシミュレート 単一のRTX3090で動作可能
研究者によって開発されたAIモデルDIAMONDは、『カウンターストライク:グローバルオフェンシブ』ゲームをシミュレートでき、Nvidia RTX3090グラフィックカード上で毎秒10フレームの速度で動作します。いくつかの欠陥はありますが、将来的にはデータと計算能力を増やすことでモデルのパフォーマンスを向上させることが期待されます。
【AiBase要約:】
🎮 DIAMONDモデルはCS:GOゲームをシミュレートでき、毎秒10フレームの速度で動作します。
📊 わずか87時間のゲームデータでトレーニングされたにもかかわらず、複雑なゲームシーンをシミュレートできます。
🐛 無限ジャンプや経路逸脱によるシミュレーションクラッシュなど、いくつかの欠陥がありますが、将来的な改善の可能性があります。
詳細リンク:https://diamond-wm.github.io/
10、NvidiaのBlackwell GPU需要が急増 今後12ヶ月の供給量は完売
Nvidiaの最新世代Blackwell GPUは前例のない需要を生み出し、CEOのジェンスン・フアン氏は今後12ヶ月の供給量が完売したことを明らかにしました。高性能コンピューティングへの渇望が再び証明されました。
【AiBase要約:】
💡Blackwell GPUの需要が急増し、今後12ヶ月分の供給量は完売しました。
🔍主要顧客にはAWS、Googleなどの大手テクノロジー企業が含まれ、市場の成長を促進しています。
📈NVIDIAは2024年に数十億ドル規模のBlackwell GPUを出荷すると予想しており、データセンターの収益が大幅に増加する見込みです。
11、Nvidiaの株価が過去最高値を更新 時価総額は3.4兆ドルに迫る
Nvidiaの株価は今週、過去最高値を更新し、時価総額は3.4兆ドルに迫っています。投資家は大きな期待を抱いています。CEOのジェンスン・フアン氏の個人資産は1215億ドルを超え、次世代Blackwellチップの需要は急増しています。NvidiaはAIチップ市場をしっかりと支配しており、時価総額はアップルに次ぐ規模で、その強力な地位を示しています。
【AiBase要約:】
🚀 Nvidiaの株価は138.07ドルの過去最高値を記録し、年初来の上昇率は180%近くに達しています。
📊 AIチップ市場における同社のシェアは70~95%に達し、時価総額は3.4兆ドルです。
💡 CEOのジェンスン・フアン氏は、次世代Blackwellチップの需要が「狂騒的」であり、来年まで完売していると述べています。