【AI日報】へようこそ!ここは、あなたが毎日人工知能の世界を探求するためのガイドです。毎日、AI分野のホットな話題を、開発者に焦点を当ててお届けします。技術トレンドの洞察や革新的なAI製品の応用を理解するお手伝いをします。

最新のAI製品詳細はこちら:https://top.aibase.com/

1.国産大規模言語モデルが新たな突破!DeepSeek R1がオープンソース化、OpenAIに匹敵する性能でAIの平等化時代を開幕

DeepSeekは最近、最新の大規模言語モデルR1をリリースし、オープンソース化しました。これは、国産AI技術における大きな飛躍を意味します。このモデルは、OpenAIのo1正式版に匹敵する性能を持ち、特に数学、コード、自然言語推論などの重要なタスクで優れた結果を示しています。

image.png

【AiBase要約:】

🌟 DeepSeek R1は、後学習段階で強化学習技術を採用し、推論能力を大幅に向上させています。

📊 6600億パラメーターのDeepSeek-R1とDeepSeek-R1-Zeroモデルをオープンソース化し、6つの小型モデルも提供することで、オープンソースエコシステムを充実させています。

💰 API価格設定はより競争力があり、キャッシュヒットは100万入力トークンあたりわずか1元で、ユーザーによる商用利用を促進しています。

詳細リンク:https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf

2.月之暗面が次世代SOTAモデルk1.5を発表:マルチモーダル推論能力がさらに進化

月之暗面社が発表したマルチモーダル思考モデルk1.5は、マルチモーダル推論と汎用推論分野における大きな進歩を示しています。このモデルは優れたマルチモーダル処理能力を備え、テキスト、画像、音声などの情報を同時に処理することで、複雑なタスクへの理解と対応能力を向上させています。k1.5の強力な汎用推論能力は、プログラミング、数学問題の解決など、さまざまな用途で優れたパフォーマンスを発揮します。

微信截图_20250121082016.png

【AiBase要約:】

🌟 k1.5モデルは、テキスト、画像、音声情報を同時に処理できる優れたマルチモーダル推論能力を備えています。

🤖 強力な汎用推論能力により、k1.5はプログラミング、数学など様々なタスクに適用でき、柔軟性が高いです。

📱 現在、k1.5モデルのプレビュー版がKimi.comとKimiスマートアシスタントアプリで利用可能です。新しい機能を体験できます。

3.無料トライアル!智譜がAI動画生成製品「清影2.0」を智譜清言で全量リリース

北京智譜華章科技有限公司がAI動画生成製品「清影2.0」をリリースしました。全面的なアップグレードにより、モデル能力と動画生成品質が大幅に向上しました。新バージョンでは、自然で滑らかな動きと美しい映像を生成でき、ユーザーは簡単な指示だけで複雑なシーンを実現できます。「清影2.0」は、芸術的なスタイルにおいても進化し、様々なスタイルの動画生成に対応しています。

微信截图_20250121103843.png

【AiBase要約:】

🚀 清影2.0の基本モデル能力は38%向上し、自然で滑らかな動画コンテンツを生成します。

🎨 新バージョンでは、様々な芸術的なスタイルの動画生成に対応し、画質の美しさが向上しています。

💡 ユーザーは簡単なプロンプトで複雑なシーンを実現でき、創造性と安定性を発揮できます。

詳細リンク:https://chatglm.cn/video?lang=zh

4.豆包アプリが新しい音声モードを発表、GPT-4oに先駆けて歌とロールプレイングを実現

豆包アプリが最新リリースした「エンドツーエンド」音声大規模モデルは、リアルタイム音声通話機能において重要なアップデートが行われ、音声インタラクション分野における大きな進歩を示しています。新しいモデルは、音声認識、理解、生成能力を統合し、人間のような表現力と感情表現を備え、対話の知性を高めています。新しいパーソナリティモードはインタラクションの楽しさを増し、豆包の感情的な寄り添いや心理相談などの用途をより広げています。

image.png

【AiBase要約:】

🎶 新しい「エンドツーエンド」音声大規模モデルは、音声認識、理解、生成を統合し、対話の円滑さを向上させています。

🌟 新しく追加された「ソウルシンガー」と「変幻自在の大スター」モードにより、豆包は歌を歌ったり、ロールプレイングを行ったりすることができ、独特の個性を発揮します。

🤖 新しいパーソナリティモード「いじられ小包」と「褒め上手」は、インタラクションの楽しさを高め、AIの応用範囲を広げています。

5.OpenAI、パソコンを制御できるAIツール「Operator」を間もなくリリース

OpenAIは、「Operator」というAIツールを開発中で、2025年1月にリリースされる予定です。このツールは、個人用パソコンを自律的に制御し、コードの作成や旅行の予約など、さまざまなタスクを実行できます。いくつかの安全評価では良好な結果を示していますが、タスク実行の成功率は人間より低く、専門家は潜在的な安全上のリスクについて懸念を表明しています。市場分析では、AIエージェント市場は今後数年間で急速に成長すると予測されています。

image.png

【AiBase要約:】

🔍 OpenAIの「Operator」ツールは、パソコンを自律的に制御し、様々なタスクを実行できるようになります。

🛠️ 「Operator」は、一部のタスクでは人間より劣っており、成功率は比較的低いです。

⚠️ 専門家は、安全評価で良好な結果を示しているものの、「Operator」の潜在的な安全上のリスクについて懸念を表明しています。

6.中国語フォントに対応!美図WHEEの「AIポスター」機能が間もなく登場

美図公司は最近、WHEEアプリの「AIポスター」機能を間もなくリリースすると発表しました。これは、人工知能技術を使用してポスター作成のプロセスを簡素化することを目的としています。ユーザーは一言入力するだけで、様々なスタイルのポスターを生成でき、特に中国語フォントに対応しており、個々のニーズを満たします。さらに、この機能は強力なカスタムレイアウト機能を提供し、複数の主要なシナリオをカバーし、ユーザーが効率的にデザインするのに役立ちます。

image.png

【AiBase要約:】

🎨 ユーザーは簡単な入力で様々なスタイルのポスターを生成でき、中国語フォントにも対応しています。

🛠️ 強力なカスタムレイアウト機能を提供し、映画、eコマースなど複数のシーンに適用できます。

✨ 「透過素材」機能がリリースされ、様々なスタイルのカスタムPNG素材の生成に対応しています。

7.百度文庫のAI機能、月間アクティブユーザー数が9000万人を突破、有料ユーザー数は4000万人を超える

最近の百度AIオープンデーイベントで、百度副社長の王穎氏は、百度文庫におけるAI技術の応用における顕著な進歩について発表しました。プラットフォームの月間アクティブユーザー数は9000万人を超え、有料ユーザー数は4000万人を突破しており、AI機能の強力な魅力を示しています。過去1年間で、百度文庫はスマートPPT、全網検索などの革新的なツールを含む100以上のAI機能を追加し、ユーザーのドキュメント処理と学習体験を大幅に向上させています。

【AiBase要約:】

📈 月間アクティブユーザー数が9000万人を突破、日次アクティブユーザー数は前年比230%増加し、プラットフォームの強力な魅力を示しています。

🛠️ スマートPPTや全網検索など、100以上のAI機能を追加し、ユーザーの多様なニーズに対応し、ドキュメント処理の効率を向上させています。

🎨 「自由キャンバス」機能がパブリックベータテストを開始し、マルチタスク処理に対応し、制作プロセスを簡素化し、ユーザーエクスペリエンスを強化しています。

8.世界初のチャットボットELIZAが復活、60年前のコードから

最近、米国と英国の研究チームが、歴史上最初の電子チャットボットELIZAのコードを復活させることに成功しました。このコードは、元々はマサチューセッツ工科大学のジョセフ・ワイゼンバウム教授が1960年代に作成したものです。研究者たちは、元のコードを発見した後、技術的な調整を行い、再実行することに成功しました。数字を入力するとプログラムがクラッシュするなど、いくつかの問題が残っていますが。

image.png

【AiBase要約:】

🗨️ ELIZAは最初の電子チャットボットであり、そのコードはジョセフ・ワイゼンバウム教授が1960年代に作成しました。

💻 研究チームは、このコードを復活させ、多くの技術的な問題を解決し、正常に動作するようにしました。

📜 ELIZAはコンピューターの歴史において重要な意味を持ち、チャットボットの先駆者とみなされています。

9.中国の研究チームがVideoChat-Flashを発表、長尺動画処理速度を100倍向上

中国の研究チームがVideoChat-Flashシステムを発表しました。階層型ビデオマーキング圧縮技術HiCoを利用することで、長尺動画処理の効率を大幅に向上させています。この技術は冗長情報を削減し、計算需要を低減すると同時に、モデルの理解能力を高めます。実験結果によると、このシステムは複数のベンチマークテストで優れた結果を示し、長尺動画処理分野の最先端モデルとなっています。

image.png

【AiBase要約:】

🌟 研究者たちは、階層型ビデオマーキング圧縮技術HiCoを提案し、長尺動画処理の計算需要を大幅に削減しました。

📹 「VideoChat-Flash」システムは、多段階学習方法を採用し、短尺動画と長尺動画を組み合わせてトレーニングすることで、モデルの理解能力を高めています。

🔍 実験結果によると、この方法は複数のベンチマークテストで新たな性能基準を達成し、長尺動画処理分野の最先端モデルとなっています。

詳細リンク:https://arxiv.org/abs/2501.00574

10.従来のウェブスクレイピングツールに別れを告げる!Firecrawl Extractはコード不要で、あらゆるウェブサイトのデータ取得を簡単に

Firecrawl Extractの登場は、ウェブスクレイピング時代の終焉を告げるものです。その自然言語処理と強力な機能により、ユーザーはスクレイピングスクリプトの作成に悩む必要がなくなり、データ分析と応用に集中できるようになり、作業効率が大幅に向上します。この革新的なツールは、データ取得をよりスマートで簡単にすることで、データ収集技術のさらなる発展を促進します。

【AiBase要約:】

🛠️ Firecrawl Extractは自然言語処理技術により、ユーザーはテキストプロンプトだけでウェブサイトのデータを取得でき、面倒なプログラミングプロセスを省けます。

🌍 このツールは、多言語と国際的なウェブサイトのデータ取得に対応し、JavaScriptでレンダリングされた動的なページコンテンツを処理し、データの正確な取得を保証します。

🔗 APIインターフェースを提供し、他のアプリケーションとの統合が容易になり、大規模データ処理に対応し、ビッグデータ分析のニーズを満たします。

詳細リンク:https://github.com/mendableai/firecrawl

11.2024年に出荷されたノートパソコンの25%以上が生成AI機能を搭載

Counterpointの最新の市場調査レポートによると、2024年の世界のPC市場は大幅に成長し、出荷台数は2億5300万台に達すると予想され、2023年比で2.6%増加します。これは、Windows10のサポート終了と次世代AIノートパソコンの発売が主な要因です。2024年第4四半期の出荷台数は前年比3.7%増加すると予想され、企業ITシステムのアップグレード需要の増加と、AIノートパソコンがユーザーエクスペリエンスを変革し、市場の発展を促進すると予想されています。

image.png

【AiBase要約:】

🌍 2024年の世界のPC出荷台数は2億5300万台に達すると予想され、前年比2.6%増加します。

💻 新しいノートパソコンの25%以上が生成AI機能を搭載し、市場のアップグレードを促進します。

📈 2025年にはAIノートパソコンが市場シェアの約60%を占め、企業からの注文増加が見込まれます。

12.テンセントの混元3D AIエンジンがリリース:高品質な3Dモデルを簡単に生成

テンセントは、混元3D AI創作エンジンを発表しました。簡単なプロンプトや画像から、高品質な3Dモデルを迅速に生成できます。このエンジンは、様々なツールや素材ライブラリを統合し、複数の3Dファイル形式に対応しており、設計効率を大幅に向上させます。混元3D-2.0モデルは、幾何学的構造とテクスチャの色において顕著な改善が見られ、複数の業界での応用に適しています。