【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツを提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、ElevenLabsがAI音声生成ツールVoice Designを発表

ElevenLabsが新しく発表したAI音声生成ツールVoice Designは、AIナレーション分野に新たな時代を切り開きました。簡単なテキストの説明だけでパーソナライズされた音声を作成でき、直感的なテキストプロンプト機能を提供します。年齢、性別、アクセント、トーン、ピッチなど、複数の音声パラメーターを調整でき、画期的にキャラクターボイスの作成にも対応し、コンテンツクリエイターにこれまでにない自由な音声カスタマイズを提供します。

【AiBase要約:】

🔊 ユーザーは必要な音声の特徴を記述するだけで、システムが要求を満たす音声を迅速に生成します。

🎭 Voice Designはキャラクターボイスの作成に対応し、仮想キャラクターの音声特徴を捉え、再現します。

🌐 AI音声のカスタマイズが新たな段階へ。ゲーム開発、オーディオブック制作などの分野に強力なクリエイティブツールを提供します。

詳細リンク:https://elevenlabs.io/voice-design

2、ControlNet超え?万能型画像生成モデルOmniGen登場、簡単なプロンプトで画像生成と精密編集を実現

OmniGenは、新しい画像生成モデルです。従来のツールとは異なり、テキストから画像の生成、画像の編集など、複数の機能を備えています。ユーザーは簡単なプロンプトを入力するだけで、画像の生成と精密な編集を制御でき、ControlNetなどのプラグインは必要ありません。このモデルはアーキテクチャが簡素化されており、変分オートエンコーダーと事前学習済みのTransformerモデルを組み合わせ、多様な大規模なデータセットでトレーニングされており、優れたパフォーマンスを発揮します。

image.png

【AiBase要約:】

⚙️ OmniGenはテキストから画像の生成、画像の編集など、複数の機能を備え、ユーザーエクスペリエンスが抜群です。

🔥 OmniGenは簡素化されたアーキテクチャを採用し、変分オートエンコーダーとTransformerモデルを組み合わせ、多様な大規模なデータセットでトレーニングされており、効果が抜群です。

🌟 OmniGenは複数のテストで驚異的なパフォーマンスを示し、テキストから画像への生成能力は市場の最先端モデルと同等で、画像編集能力も優れています。

体験入口:https://huggingface.co/spaces/Shitao/OmniGen

3、科大訊飛が星火4.0Turbo大規模モデルを発表

科大訊飛は、グローバル1024開発者会議で、訊飛星火4.0Turbo大規模モデルを発表しました。以前のバージョンとGPT-4Turboを上回り、数学とプログラミング能力で優れたパフォーマンスを発揮し、効率が50%向上しました。同時に、星火コード7Bバージョンと超人間的なデジタルヒューマンを発表し、意味が貫通した自然なインタラクション体験を実現しました。

image.png

【AiBase要約:】

✨ 訊飛星火4.0Turboは、数学とプログラミング能力においてGPT-4Turboを上回り、全体の効率が50%向上しました。

🔥 14の主要なテストのうち9項目で1位を獲得し、卓越したパフォーマンスを示しました。

💡 星火コード7Bバージョンと超人間的なデジタルヒューマンを発表し、マルチモーダルインタラクションとよりリアルなインタラクション体験を実現しました。

4、OpenAIが新しいモデルsCMを発表、コンテンツ生成速度が50倍向上、画像生成はわずか0.1秒

OpenAIの研究チームは、画期的な研究成果を発表し、新しい連続時間一貫性モデル(sCM)を紹介しました。このモデルはマルチメディアコンテンツの生成速度を飛躍的に向上させ、従来の拡散モデルと比べて50倍高速化しました。sCMは0.1秒未満で画像を生成し、わずか2回のサンプリングで高品質なサンプルを生成できます。将来の応用範囲は広く、可能性は計り知れません。

image.png

【AiBase要約:】

📈 速度が50倍向上し、画像生成時間は0.1秒に短縮されました。

🖼️ わずか2回のサンプリングで、sCMは高品質なサンプルを生成し、効率が大幅に向上しました。

⚙️ 将来の応用範囲は広く、リアルタイムの画像、音声、ビデオ生成など、可能性は計り知れません。

詳細リンク:https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/

5、GoogleがAIテキスト透かしツールSynthIDをオープンソース化

Googleは最近、AI生成テキストの識別を支援するテキスト透かしツールSynthIDをオープンソース化しました。この取り組みは、虚偽情報や不適切なコンテンツへの対策に重要な意味を持ち、同時にAI技術の発展と応用を促進します。

【AiBase要約:】

📜 SynthIDがオープンソース化され、開発者はAI生成テキストの識別を支援します。

🛠️ 透かし技術は、虚偽情報や不適切なコンテンツへの対策でますます重要になっています。

💡 GoogleのSynthIDは、テキスト生成の確率スコアを微調整して透かしを作成します。

詳細リンク:https://ai.google.dev/responsible/docs/safeguards/synthid?hl=zh-cn

6、iOS18.2beta1が開発者にリリース、ChatGPT統合を含む

image.png

Appleは最近、iOS18.2の最初の開発者向けベータ版をリリースし、Genmoji絵文字、Image Playground画像生成、AI駆動のライティング機能、ChatGPT統合、Visual Intelligenceなど、いくつかの新しいApple Intelligence機能を追加しました。AppleのApple Intelligence機能は、よりスマートでパーソナライズされたエクスペリエンスを提供することを目的としていますが、Siriに画面の内容を理解させるなどの機能はまだ実現していません。

【AiBase要約:】

🌟 iOS18.2Beta1でSiriがChatGPTに正式に統合され、自然言語理解能力が向上しました。

 🎨 新しいGenmojiとImage Playground機能により、ユーザーはパーソナライズされた絵文字と画像を生成できます。

 📱 Visual Intelligence機能は、iPhone16のカメラを使用してスマート検索を行い、情報取得効率を向上させます。

7、14歳の少年がチャットボットに夢中になった後、不幸にも亡くなり、Character.AIとGoogleが訴訟に直面

この記事は、14歳の少年がCharacter.AIのチャットボットとのやり取りに夢中になった結果、命を絶ったという事件を報道しており、訴訟を引き起こしています。この記事では、Character.AIが許可されていない心理療法を提供したこと、そして過度に擬人化されたチャットボットのデザインに関与したとして、職務怠慢と誤解を招く行為があったと主張しています。同時に、Character.AIは未成年ユーザーを保護し、精神的な健康リスクを軽減するための新しい安全対策を発表しました。

【AiBase要約:】

🔍 訴訟は、Character.AIとGoogleが職務怠慢と誤解を招く行為があったと主張し、注目と議論を引き起こしています。

💬 許可されていない心理療法を提供したこと、チャットボットのデザインが過度に擬人化されていたことが、倫理的および法的論争を引き起こしています。

🔒 Character.AIは、未成年者向けモデルの修正、免責事項の追加など、ユーザー保護策を強化するための新しい安全対策を発表しました。

8、OpenAI科学者:20秒の思考は10万倍のデータより効果的!

最近のTED AIカンファレンスで、OpenAIの研究科学者ノアム・ブラウンは、OpenAIが新しく発表したo1モデルを紹介し、システム2思考がさまざまな業界の意思決定方法を変えることの重要性を強調しました。ブラウン氏は、20秒間の思考時間は10万倍のデータよりも優れた効果をもたらすと指摘し、o1モデルは複数の分野で卓越した性能を発揮していると述べました。彼は、AIはデータ処理を超えて、より熟考されたシステム2思考へと進む必要があると強調しました。

【AiBase要約:】

🧠 システム2思考は、将来のAI開発の鍵であり、意思決定の質を向上させます。

⏳ 20秒間の思考時間は、10万倍のデータよりも優れた効果をもたらします。

💡 OpenAIが新しく発表したo1モデルは、複数の分野で卓越した性能を発揮しています。

9、研究者らが新しいLLM脱獄方法を開発、成功率は最大65%

最近、サイバーセキュリティ企業Palo Alto NetworksのUnit42研究チームは注目すべき研究を発表し、「Deceptive Delight」と呼ばれる新しい脱獄方法を明らかにしました。この方法は、わずか2〜3回のやり取りで、大規模言語モデル(LLM)を有害なコンテンツの生成に誘導することに成功し、その成功率は最大65%に達し、LLMのセキュリティ保護に警鐘を鳴らしています。

【AiBase要約:】

🔍 新しい脱獄方法は、2〜3回のやり取りでLLMを有害なコンテンツの生成に誘導し、成功率は最大65%に達します。

📈 モデルによって成功率に大きな違いがあり、単一モデルの成功率は最大80.6%に達します。

🛡️ コンテンツフィルターと明確なシステムプロンプトを追加して、セキュリティを向上させることをお勧めします。

10、AppleがApple Intelligence向けに3つのAPIを発表

Appleが最近発表した開発者向けベータ版には、Genmoji、Image Playground、Visual Intelligence、Image Wand、ChatGPT統合など、多くの新しいApple Intelligence機能が追加され、ユーザーエクスペリエンスが大幅に向上しました。今回のアップデートでは、開発者がAppleの小型モデル生成AIをアプリケーションに統合できるように、3つの主要機能のAPIも発表されました。英語のローカライズが複数の国に拡大されましたが、今後さらに多くの言語に対応する予定ですが、中国とEUのユーザーにとっては不確実性がある可能性があります。

【AiBase要約:】

🌟 AppleはiOS18.2などの新しいベータ版を発表し、多くのApple Intelligence機能を発表しました。

🐱 新しいAPIは、開発者が生成AIをアプリケーションに統合するのに役立ちます。

🌍 英語のローカライズが複数の国に拡大され、今後さらに多くの言語に対応する予定です。

11、ZoomがAIアシスタント2.0版を発表:会議の要点を簡単に整理

Zoomが新しく発表したAIアシスタント2.0版は、ユーザーにより効率的なワークマネジメントとチームコラボレーション体験を提供します。AI Companion2.0は、会議中にリアルタイムでサポートを提供するだけでなく、メールやチャットログの管理、感謝状の作成なども行い、作業効率を総合的に向上させます。ZoomはAI優先ワークプラットフォームへの重要な一歩を踏み出し、有料アカウントを持つユーザーに無料で提供します。

image.png

【AiBase要約:】

✨ AI Companion2.0はZoomが新しく発表したAIアシスタントで、作業効率の向上を目指しています。

🤖 ユーザーは会議中に質問してリアルタイムのサポートを受け、重要な情報を簡単に確認できます。

📄 AIアシスタントは、メールやチャットログの管理、感謝状の作成、プロジェクトドラフトの生成をサポートします。