【AI日報】へようこそ!ここは、毎日人工知能の世界を探求するためのガイドです。毎日、AI分野のホットな話題をお届けし、開発者に焦点を当て、技術トレンドの洞察や革新的なAI製品の応用について理解を深めるお手伝いをします。

最新のAI製品詳細はこちら:https://top.aibase.com/

1.OpenAI、ChatGPT Plusユーザー向けに高度な音声モードをリリース

OpenAIは、より自然でリアルタイムの会話体験を提供する高度な音声モードを発表しました。ユーザーは会話を中断したり、応答の感情を感知したりできます。テストユーザーにはメールで通知が送信され、秋にはすべてのPlusユーザーが利用できるようになる予定です。ビデオと画面共有機能も導入されます。GPT-4oは多言語でテストされ、プライバシー保護を強化し、評価レポートの公開も予定されています。

【AiBase要約:】

🔊 高度な音声モードは、より自然でリアルタイムな会話体験を提供し、ユーザーは会話を中断したり、応答の感情を感知したりできます。

📧 テストユーザーにはメールで通知が送信され、秋にはPlusユーザー全員への提供が予定されています。

🔗 OpenAIは、GPT-4oの能力、限界、およびセキュリティに関する評価レポートの公開を予定しています。

2.OpenAI、新しいモデルgpt-4o-64k-output-alphaを公開、GPT-4o APIで最大64Kの出力に対応

OpenAIは、新しい実験的なモデルgpt-4o-64k-output-alphaを発表しました。最大の特徴は、一度に64Kトークンの長さを出力できることで、より豊富で詳細なコンテンツを提供しますが、価格は高くなります。このモデルは、より長いテキストを必要とするユーザーのニーズに応え、ライティング、プログラミング、データ分析をサポートします。長テキスト生成の費用は、出力トークン100万個あたり18ドルで、計算コストに見合うように設定されており、ツールの合理的な利用を促しています。

image.png

【AiBase要約:】

📈 GPT-4oモデルは最大64Kの出力に対応し、詳細なコンテンツが必要なユーザーに最適です。

💰 長テキスト生成の費用は高く、出力トークン100万個あたり18ドルです。

📝 このモデルは、創作や研究分野における新たな可能性を切り開き、より深い交流と創作を促進します。

3.Midjourney V6.1版リリース、遠景の人物の顔の最適化、より詳細な描写を実現

MidjourneyはV6.1版をリリースし、よりスマートで高速、クリアで、詳細な描写と美しいアップデートを提供します。今回のアップデートでは、画像の一貫性を向上させ、画質を全面的に向上させ、微細なディテールを正確に処理し、パフォーマンスと速度を向上させ、テキストの精度を高め、パーソナライズされたモデルをアップグレードし、「--q2」モードを追加することで、全体的な美学が向上しています。

image.png

【AiBase要約:】

✨ 画像の一貫性の向上:複雑な構造の処理がより自然でスムーズになり、創作への自信を高めます。

🌟 画質の全面的な向上:ピクセルノイズを減らし、テクスチャ表現力を高め、より幅広いスタイル表現の空間を提供します。

🔍 微細なディテールの正確な制御:小さな画像の特徴を驚くほど正確に処理し、作品の実在感と表現力を高めます。

詳細はこちら:https://top.aibase.com/tool/midjourneywangyeban

4.小米「大モデル小愛」全面アップグレード:AI画像編集機能などをサポート

小米は、新しい大モデル版のXiao Aiが、スマートフォン、タブレット、スマートテレビ、スマートスピーカー、自動車など、製品ライン全体で全面的にアップグレードされることを発表しました。このアップグレードにより、AI画像編集や車外音声起動防御などの革新的な機能が追加されます。各製品ラインの機能アップグレードにより、ユーザーエクスペリエンスと実用性が向上します。

image.png

【AiBase要約:】

🚀 Xiao Aiが全面的にアップグレードされ、複数の製品ラインを網羅し、革新的な機能が追加されました。

💡 スマートフォンでは、AI画像編集、ドキュメントQ&A、スマートな動画作成に重点が置かれています。

📺 スマートテレビでは、映画やテレビ番組に関するQ&A、フィットネスやレジャーのガイダンス、家庭計画の作成などが提供されます。

5.百度飛槳PaddleX3.0-beta昇騰版リリース

PaddleX3.0-beta昇騰版は、飛槳がリリースしたエンドツーエンドのローコード開発ツールで、開発者が低コストで、ゼロから始めることなく、産業における現実の問題を解決できるようにすることを目指しています。このバージョンは7つの主要なAIシーンに焦点を当て、豊富なモデル選択肢とローコード開発方式を提供し、Huawei昇騰910チップに深く対応することで、ユーザーに便利な開発パラダイムを提供します。

image.png

【AiBase要約:】

🚀 豊富なモデル選択肢があり、画像分類、物体検出、テキスト画像レイアウト分析など、複数のタスクシナリオをカバーしています。

⚙️ ローコード開発方式により、統一されたAPIインターフェースで全工程の開発を実現し、ユーザーによるカスタムモデルプロセスの連結をサポートします。

💻 Huawei昇騰910チップに深く対応し、ユーザーの多様なニーズに対応します。

詳細はこちら:https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta

6.AI仮想着せ替えモデルCatVTON:パラメーターわずか899.06M、高解像度に対応

CatVTONは、ファッション愛好家に最適な小型AI仮想着せ替えモデルで、軽量ネットワークと低メモリ要件を備え、高解像度操作に対応しています。最新リリースのコードと展開プロセスにより、ユーザーは自宅で簡単に仮想試着技術を体験でき、ComfyUIとGradioアプリケーションへの展開にも対応し、操作が簡単です。

image.png

【AiBase要約:】

🐈 軽量ネットワークで、総パラメーター数は899.06M、トレーニングパラメーター数は49.57M、推論時のメモリ要件は8G未満で、個人用コンピューターでの操作に適しています。

💻 ComfyUIで迅速に展開でき、簡単な手順で仮想試着技術を体験できます。

👗 VITON-HDとDressCodeデータセットで推論でき、さまざまな精度オプションに対応し、さまざまなハードウェア条件に対応します。

詳細はこちら:https://top.aibase.com/tool/catvton

7.AIヘアスタイル変更ツールStable-Hair:ヘアスタイルの転送を実現

Stable-Hairは革新的なヘアスタイル転送技術で、従来の方法では処理できなかった複雑なヘアスタイルの問題を解決し、ユーザーに全く新しい試着体験を提供します。数多くの実験で検証された結果、Stable-Hairはヘアスタイル転送効果において業界をリードするレベルに達し、ユーザーの試着体験を向上させています。

image.png

【AiBase要約:】

🌟 Stable-Hairは、従来の方法では処理できなかった複雑なヘアスタイルの問題を解決しました。

👨‍🔬 2段階のプロセスを採用し、まず髪を取り除いてからヘアスタイルを転送します。

🏆 Stable-Hairは実験で優れた性能を示し、業界をリードするレベルに達しています。

詳細はこちら:https://github.com/Xiaojiu-z/Stable-Hair

8.ファンが純愛戦士に変身!AIで相柳と抱擁し、ソーシャルメディアを沸かせる

この記事では、人工知能技術が仮想的な感情表現の分野でどのように活用されているかを議論しています。話題のドラマ「長相思2」の登場人物、相柳を例に、ファンがAIで生成された動画を通じてキャラクターとインタラクションし、斬新な感情のはけ口を示しています。しかし、この記事では、仮想世界に過度に没頭することのリスク、現実生活での感情のバランスを保つことの重要性についても警告しています。

image.png

【AiBase要約:】

🤖 AI技術により、ファンは仮想的なインタラクションを通じて感情を表現し、革新的な動画生成方法がブームを巻き起こしています。

💑 AIカップル写真がソーシャルメディアで流行し、ファンはアイドルとの親密な触れ合いを実現しています。

🧠 AI技術はエンターテインメント分野に大きな影響を与え、架空のキャラクターへの感情的な執着に対処するための新しい方法を提供しています。

9.Meta、有名人チャットボットプロジェクトを閉鎖、AI創作ツールAI Studioに注力

Metaは最近、有名人チャットボットプロジェクトを閉鎖し、AI Studioに方向転換することを発表しました。AI Studioは、クリエイターが独自のチャットボットを作成できる新しいツールです。以前は多額の資金を投じていましたが、有名人チャットボットプロジェクトは期待どおりにはいかず、Metaは依然としてAIチャットボットに期待を寄せています。CEOのマーク・ザッカーバーグはAIチャットボットの重要性を強調し、複数のプラットフォームでMeta AIアシスタントの普及を続けています。

image.png

【AiBase要約:】

🔥 Metaは有名人チャットボットプロジェクトを閉鎖し、AI創作ツールAI Studioに注力しています。

💰 有名人肖像権使用料に高額な費用を支払いましたが、プロジェクトは期待どおりにはなりませんでした。

🤖 CEOのマーク・ザッカーバーグはAIチャットボットの重要性を強調し、複数のプラットフォームでMeta AIアシスタントの普及を続けています。

10.TikTokのインフルエンサー「マケナ」、再び神作品!AIで書き直した「童話町」の抽象的な歌詞が73万いいねを獲得

最近、TikTokでAIが歌詞を書き直し、歌われた「童話町」が話題となり、73万を超えるいいねを獲得し、ネット上で大きな話題となっています。AIバージョンの歌詞は抽象的なイメージに満ちており、歌声も素晴らしく、深い思考を促します。AIによる創作は、抽象的な思考や創作のロジックについて人々に考えさせます。同時に、ネットカルチャーにおける斬新なコンテンツへの熱狂を反映しており、AIによる創作は冷静に評価する必要があります。「童話町」のAIバージョンは、AIがクリエイティブな分野で持つ可能性を示し、一般の人々のAIアート創作への関心を高めています。

image.png

【AiBase要約:】

⚡ AIが歌詞を書き直した「童話町」がTikTokで話題となり、73万を超えるいいねを獲得し、AIが音楽創作分野で持つ可能性を示しました。

🎭 AIバージョンの歌詞は抽象的なイメージに満ちており、歌声も素晴らしく、AIの創造力について人々に深い思考を促します。

🌐 現代のネットカルチャーにおける斬新でユーモラスなコンテンツへの熱狂を反映しており、AIによる創作は冷静に評価し、AI創造力の本質と限界を探求する必要があります。

11.周鴻禕氏、360安全大モデルを無料公開

周鴻禕氏は、360グループが360安全大モデルを無料で公開することを発表しました。これは、大規模モデル技術の普及、安全業界の技術進歩と生産性革命の推進を目的としており、より多くの企業や個人が大規模モデル技術を利用できるようにすることを目指しています。

【AiBase要約:】

🔑 360グループは360安全大モデルを無料で公開し、大規模モデル技術の普及と安全業界の技術進歩を目指しています。

💡 360標準製品を購入したユーザーには、大規模モデルの標準機能を無料で提供し、製品機能の強化を実現します。

🚀 360グループは、数百億のパラメーターを持つ独自の汎用大規模モデル「360智脳」の開発に成功し、市場における影響力と技術力を示しました。

12.雷軍氏、もし自動車を作っていなかったらAIをやっていたはず:30年以上前に多くのAIコースを受講

雷軍氏は最近のインタビューで、小米が自動車製造に進出していなければ、同社は人工知能分野にさらに注力していた可能性があると述べています。自動車プロジェクトへの投資にもかかわらず、小米は人工知能分野で業界の後塵を拝していません。2016年からAI分野への全面的な投資を開始しています。雷軍氏自身もAIについて深い理解を持っており、ここ数年は自動車プロジェクトに注力していますが、AI関連の仕事にも積極的に取り組んでいます。

【AiBase要約:】

🚗 小米は自動車製造に進出していなければ、人工知能分野にさらに注力していた可能性があります。

💡 小米は人工知能分野で業界の後塵を拝しておらず、2016年からAI分野への全面的な投資を開始しています。

💼 雷軍氏はAIについて深い理解を持っており、ここ数年は自動車プロジェクトに注力していますが、AI関連の仕事にも積極的に取り組んでいます。