AI日報：可図がワンクリック着替えソフトをリリース；Grok-2がチャットボットランキング2位に躍進；大学生がClaude 3.5で核融合炉を成功裏に開発

【AI日報】へようこそ！ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットな話題を、開発者に焦点を当ててお届けします。技術トレンドの洞察、革新的なAI製品の応用を理解するお手伝いをします。

最新のAI製品はこちらからご覧ください:https://top.aibase.com/

1、可图がワンクリック着せ替えアプリ「Kolors Virtual Try-On」をリリース

Kolors Virtual Try-Onに関する記事が気に入っています。このアプリは、ショッピングをより簡単にします。写真をアップロードするだけで、バーチャル試着室で様々なスタイルを試着でき、サイズや色の間違いを避け、パーソナライズされたファッション体験を楽しむことができます。この最先端技術は、ショッピングの精度と効率を高めるだけでなく、ショッピングをより楽しくします。

【AiBase要約:】
👗 家にいながら簡単に様々な服を試着でき、サイズや色の問題を回避できます。
📊 アプリはユーザーにバーチャル試着室を提供し、服が自分の体によく似合うかを確認でき、ショッピングの精度と効率を向上させます。
💡 企業はユーザーの試着データを利用して市場トレンドや消費者の好みを把握し、製品ラインとマーケティング戦略を最適化できます。
詳細リンク:https://top.aibase.com/tool/kolors-virtual-try-on

2、xAI Grok-2がチャットボットランキングで2位にランクイン、GPT-4oに次ぐ

xAIチームのGrok-2とGrok-MiniモデルがLMSysチャットボットアリーナランキングで目覚ましい活躍を見せ、Grok-2はOpenAIのGPT-4oを上回り2位にランクイン、Geminiと並んでトップを争っています。Grok-2は数学問題で1位を獲得し、他の多くのタスクでも優れた成績を収めました。Grok-2-Miniは速度が2倍に向上し、大幅な性能向上を実現しました。

【AiBase要約:】
✨ Grok-2はLMSysチャットボットランキングで2位を獲得し、GPT-4oを上回り、Geminiと並んで2位にランクインしました。
🚀 Grok-2は数学タスクで優れたパフォーマンスを発揮し、1位を獲得、他の多くのタスクでも上位にランクインしました。
💡 Grok-2-Miniは速度が2倍に向上し、性能がさらに向上しました。

3、Claude3.5が活躍！大学生がAIの助けを借りて自宅で小型核融合炉を建造

この記事では、00後数学科のHudhayfaさんがAIアシスタントClaude3.5の助けを借りて、自宅の寝室で小型核融合炉を成功裏に建造した物語を紹介しています。彼の決意とAIアシスタントの助けにより、ハードウェアの経験不足を克服し、テクノロジーの夢を実現しました。

【AiBase要約:】
🤖 HudhayfaはAIアシスタントClaude3.5の助けを借りて小型核融合炉の建造に成功し、テクノロジーの夢の実現力を示しました。
🔧 部品への習熟、主腔体の設計、半橋流器の組み立てなど、Hudhayfaは建造プロセスを完了しました。
⚛️ Hudhayfaは実験で課題に直面しましたが、一流のエンジニアや教授の助けを得て、今後の改善の方向性が示されました。
詳細内容：https://www.aibase.com/zh/news/11281

4、アップルが生成AI搭載ロボットアームを開発中、スマートホーム体験を変える可能性

アップルが正式にロボット市場に参入し、生成AIを搭載したデスクトップデバイスを発売する計画です。2026年または2027年の発売が予定されています。この取り組みはスマートホームに革命的な変化をもたらし、ユーザーにより便利な生活体験を提供します。

【AiBase要約:】
🌟 アップルは生成AIを搭載したデスクトップデバイスを発売する計画で、2026年または2027年の発売が予定されています。
🤖 デバイスにはロボットアームが搭載され、画面の自動回転など、日常生活の問題を解決できます。
🚀 成功すれば、アップルはさらにモバイルロボットやヒューマノイドロボットの開発を進める可能性があります。

5、雲知声、山海マルチモーダル大規模言語モデルを発表：音色の自由な切り替え、視覚シーンの理解に対応

雲知声は山海マルチモーダル大規模言語モデルを発表し、人工知能分野に新たな活力を注入しました。このモデルはマルチモーダル入力と出力を実現し、スムーズな音声対話とパーソナライズされた視覚体験を提供します。スマートライフとスマート医療の分野で重要な意味を持ちます。

【AiBase要約:】
🔊 山海マルチモーダル大規模言語モデルは、テキスト、音声、画像など様々なモーダル入力と任意の組み合わせによる出力をサポートし、効率的な音声対話を実現します。
👥 モデルには高度な音声対話機能があり、感情表現や音色の自由な切り替えをサポートし、パーソナライズされた体験を提供します。
👁️ モデルはカメラを通して環境を理解し、物体を認識し、視覚コンテンツを作成することで、正確なシーン分析とパーソナライズされた視覚体験を実現します。
詳細リンク:https://shanhai.unisound.com/

6、Google、出版社に迫る選択：AI回答への参加か、露出の喪失か！

Googleは検索エンジンの市場優位性を活用し、出版社にAI回答への参加か、検索結果からの露出喪失リスクを負うかの難しい選択を迫っています。この状況は多くの出版社に困惑と不満をもたらしています。

【AiBase要約:】
🔍 Googleは市場優位性を活用し、出版社にAI回答への参加または検索結果からの露出喪失リスクを負うよう迫っています。
🚫 出版社は「nosnippetタグ」を使用してコンテンツがAI回答に使用されるのを防ぐことができますが、全体の検索ランキングに影響を与える可能性があります。
💰 Googleは出版社とのコンテンツ使用許諾に関する交渉を停止しており、AI企業は補償を通じて問題解決を試みています。

7、韓国ゲーム会社が仮想育成ゲーム「inZOI」をリリース：AI魔法で現実と仮想世界がシームレスに接続

「inZOI」は画期的なゲームで、AI技術により現実と仮想世界のシームレスな接続を実現し、かつてない創造の自由とパーソナライズされた体験をプレイヤーに提供します。このゲームは新たな可能性を切り開き、プレイヤーに創造性を発揮できるプラットフォームを提供します。

【AiBase要約:】
✨ ゲームには現実のアイテムをゲームシーンに取り込める魔法のような2Dから3Dへの変換機能があり、現実と仮想世界の境界を曖昧にします。
🏡 完全な自由度の建築プラットフォームを提供し、プレイヤーは夢の住まいを創造できます。細部から家具までプレイヤーが自由に設計し、個性を表現できます。
😃 画期的なモーションキャプチャツールがプレイヤーの表情をリアルタイムで捉え、ゲームキャラクターに正確に反映することで、唯一無二のキャラクター体験を生み出します。

8、Metaが視覚分析モデル「Sapien」を発表

Meta Reality Labsは最近、「Sapiens」というAIモデルを発表しました。3億枚以上の人間の画像でトレーニングされ、複雑な環境下での人間の視覚タスク処理において卓越した能力を示しています。Sapiensは、大規模データセットの事前トレーニング、ビジョントランスフォーマーアーキテクチャ、マルチタスク学習などの高度な手法を採用しており、幅広い応用が期待されます。実験結果から、Sapiensは複数のタスクで高い精度と一貫性を示しています。

【AiBase要約:】
🔍 Sapiensモデルは人間の視覚タスク処理において大きな進歩を遂げ、人体姿勢の正確な認識や深さ情報の予測が可能です。
🚀 Sapiensは大規模データセットの事前トレーニングとビジョントランスフォーマーアーキテクチャを採用し、強力な汎化能力と高解像度推論能力を示しています。
💡 Sapiensは、ビデオ監視、医療、ソーシャルメディア、仮想現実などの分野で幅広く活用され、モーションキャプチャ、医療支援、ユーザーエクスペリエンスの向上に貢献します。
詳細リンク:https://about.meta.com/realitylabs/codecavatars/sapiens

9、心辰Lingo：国内初のエンドツーエンド音声大規模言語モデル

心辰Lingoは、GPT-4の音声能力に匹敵する国内初のAIシステムであり、中国の音声AI分野における大きな進歩を示しています。このモデルは、ネイティブ音声理解、多様な音声スタイル表現、効率的な音声モーダル圧縮という3つのコアな強みを持ち、ユーザーにより自然で生き生きとしたインタラクション体験を提供します。

【AiBase要約:】
🌟 ネイティブ音声理解、多様な音声スタイル表現、効率的な音声モーダル圧縮は、心辰Lingoの3つのコアな強みです。
🚀 心辰Lingoは音声スタイルを柔軟に調整でき、様々なアプリケーションシナリオに対応し、包括的でスムーズな音声インタラクション体験を提供します。
💡 心辰Lingoは完全なインタラクションプロセスを統合し、ユーザーに高品質の音声コンテンツを提供し、スマートアシスタント、音声インタラクション、教育トレーニングなどの分野で重要な役割を果たすことが期待されます。
詳細リンク:https://lingo.xinchenai.com/

10、AIによる株選びは期待外れ：ほとんどのファンドがS&P500指数を下回る

AIは株式市場では期待通りの成果を上げていません。AIに依存した取引所取引ファンドのほとんどは、S&P500指数を下回っています。研究によると、AIに完全に依存したファンドの年間平均損失は1.8%に達し、株式市場の好調時に利益を得ることができませんでした。AIはデータパターンを見つけることができますが、データの裏にある真の意味をまだ理解していません。

【AiBase要約:】
🌟 AIに依存した取引所取引ファンドのほとんどは、S&P500指数を下回っています。
📉 AIに完全に依存したファンドの年間平均損失は1.8%に達し、株式市場の好調時に利益を得ることができませんでした。
🤖 AIはデータパターンを見つけることができますが、データの裏にある真の意味をまだ理解していません。

11、復旦大学の新研究！RECE――AI界の「記憶消去術」：不適切な画像を消し去る

復旦大学研究チームが開発した概念消去術（RECE）技術は、AIに革命的な変化をもたらし、不適切な画像を過去のものにします。この画期的な技術はわずか3秒でAIの考え方を完全に変え、正確かつ効率的に機能します。専門家はAIの創造性が影響を受ける可能性を懸念していますが、この技術はAIの将来の発展に新たな道を切り開き、AIをより賢く、より機敏なものにします。

【AiBase要約:】
🧹 概念消去術（RECE）技術により、AIは考え方を完全に変え、不適切な画像の生成を排除します。
🎨 研究チームは閉鎖型ソリューションを使用してAIモデルを正確に修正し、その創造性を維持します。
💡 RECE技術はAIの将来の発展に新たな道を切り開き、AIをより賢く、より機敏なものにします。
詳細リンク:https://arxiv.org/pdf/2407.12383

12、ムーアセラミックスが音声理解大規模言語モデルMooER（ムーア）をオープンソース化

ムーアセラミックス社は音声理解大規模言語モデルMooER（ムーア）をオープンソース化し、人工知能分野における最新の成果を示しました。このモデルは短期間でトレーニングが完了し、優れた音声認識と翻訳能力を示しています。オープンソースプロジェクトを通じて、開発者に貴重なリファレンスとサポートを提供します。

【AiBase要約:】
🔍 MooERは、国産のフル機能GPUを使用してトレーニングと推論を行う、業界初のオープンソースの大規模音声モデルです。
💡 MooERは、中国語と英語の音声認識、および中国語から英語への音声翻訳機能を備えています。
🚀 MooERは、中国語と英語のテストセットにおいて、他のオープンソースモデルよりも優れたパフォーマンスを示しています。
詳細リンク:https://github.com/MooreThreads/MooER

13、人事異動！OpenAIが元Meta幹部を戦略企画担当に任命

OpenAIは最近、元Meta幹部のIrina Kofman氏を戦略企画監督として任命しました。AIの安全性と準備性の向上に注力します。同社は競争力を強化するために積極的に幹部を採用しており、同時に幹部の退社も発生しています。最近発表されたGPT-4oのアップデートにより、開発者は特定のビジネスニーズに合わせてAIモデルを微調整し、パフォーマンスを向上させ、ニーズに合ったAIツールを作成できるようになりました。

【AiBase要約:】
👩‍💼 Irina Kofman氏がOpenAIの戦略企画監督に就任し、AIの安全性と準備性の向上に注力します。
🔥 同社は競争力を強化するために積極的に幹部を採用しており、同時に幹部の退社も発生しています。
🚀 GPT-4oのアップデートにより、開発者は特定のビジネスニーズに合わせてAIモデルを微調整し、パフォーマンスを向上させ、ニーズに合ったAIツールを作成できるようになりました。

14、2023年中国AIパブリッククラウドサービス市場が急成長：規模は126億元を突破、58.2%増

最近発表されたIDCのレポートによると、中国のAIパブリッククラウドサービス市場規模は2023年に126.1億元人民元に達し、58.2%もの高い成長率を示し、大きな可能性を秘めています。市場競争は激しく、主要なクラウドサービスプロバイダー間の差は縮小しつつあり、AI技術の成熟が市場の発展を促進しています。