【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求する毎日ガイドです。毎日、AI分野のホットなコンテンツを提供し、開発者に焦点を当て、技術トレンドの洞察と革新的なAI製品の応用を理解するお手伝いをします。
最新のAI製品詳細はこちら:https://top.aibase.com/
1、潞晨が無料動画生成モデルVideo Ocean V2.0をアップデート、20秒の高画質大作がワンクリックで作成可能に
AI技術が急速に発展する現代において、潞晨科技が発表したVideo Ocean V2.0は、動画制作における新たな大きな飛躍を意味します。このツールは完全に無料で、画質、動きの表現、制作の自由度が大幅に向上しました。ユーザーは簡単なテキストプロンプトや参考画像から高品質の動画を生成でき、操作インターフェースも使いやすく、専門家から一般ユーザーまで幅広く利用できます。
【AiBase要約:】
🌟 画質向上:人物の顔の細部、光の変化、環境との相互作用が非常にリアルになりました。
🏃 動作表現:日常的な動作からエクストリームスポーツまで、滑らかで自然な表現が可能です。
🎨 多様な制作スタイル:3Dリアル、2Dアニメーション、映画のような質感、サイバーパンクなど、様々なスタイルに対応しています。
体験版はこちら:video.luchentech.com/zh-CN
2、驚きの発表!DeepSeekアプリが正式リリース、iOSとAndroid版が両方利用可能に
DeepSeekは、深度思考とインターネット検索をサポートする新しいアプリをリリースしました。iOSとAndroidの両方に対応しています。このアプリはDeepSeek-R1-Liteモデルを用いて思考連鎖分析を行い、ユーザーが段階的に問題を解決するのを支援します。また、DeepSeek V3モデルはインターネット上の情報を迅速に取得し、簡潔な回答を生成します。さらに、スマートな会話、正確な翻訳、創造的なライティング、効率的なプログラミング、スマートな問題解決など、様々な機能を提供し、ユーザーの作業効率を大幅に向上させます。
【AiBase要約:】
🧠 深度思考機能は思考連鎖分析によって問題を分析し、結論を導き出します。
🌐 インターネット検索機能は情報を迅速に取得し、正確な回答を生成します。
📄 アプリはファイルのアップロードに対応しており、スマートな会話や様々な実用的な機能を提供します。
3、OpenAIがロボットプロジェクトで人材募集開始、独自開発のセンサーとヒューマノイドロボットの開発を計画
OpenAIは最近、ロボット技術の発展を探求することを目的としたロボットプロジェクトを開始すると発表しました。このプロジェクトでは、カスタムセンサーを搭載したロボットを開発し、電子感知エンジニア、ロボット機械設計エンジニア、技術プロジェクトマネージャーなど、複数の重要なポジションを募集しています。各ポジションの年収は34万~44万ドルです。OpenAIの目標は、汎用的で適応力があり、多機能なロボット、おそらくヒューマノイドロボットを開発することです。
【AiBase要約:】
🔍 OpenAIがロボットプロジェクトを開始し、電子感知エンジニアなど複数のポジションを募集しています。
🤖 汎用的で適応力のあるロボットの開発を計画しており、ヒューマノイドロボットも視野に入れています。
💡 OpenAIはヒューマノイドロボット技術企業への投資を通じて、ロボット研究の進展を継続的に推進しています。
4、研究者らが推論型AIモデルSky-T1をオープンソース化、トレーニングコストは450ドル未満
カリフォルニア大学バークレー校のSky Computing Labチームは、推論型AIの開発コストと難易度を大幅に削減したオープンソースの推論型AIモデルSky-T1-32B-Previewを発表しました。このモデルは複数のベンチマークテストで優れたパフォーマンスを示し、トレーニングコストはわずか450ドルで、従来の何百万ドルものコストを大幅に削減しました。
【AiBase要約:】
💰 Sky-T1のトレーニングコストはわずか450ドルで、推論型AIの開発ハードルを大幅に下げました。
📊 MATH500などのベンチマークテストで、Sky-T1はOpenAIのo1初期バージョンを上回るパフォーマンスを示しました。
🔍 NovaSkyチームは、推論性能と精度を向上させるために、より効率的なオープンソースモデルの開発を継続する予定です。
5、Googleが時系列予測モデルTimesFM2.0をオープンソース化、小売売上高や株価の予測に利用可能
Googleの研究チームは、予測精度を向上させることを目的とした、時系列予測用に設計された事前学習済みモデルTimesFM2.0を発表しました。このモデルは最大2048個の時間点の単変量予測をサポートし、任意の時間範囲を処理できます。オープンソース化と科学的な共有を通じて、TimesFM2.0はユーザーに様々な分野を網羅した豊富なデータセットを提供し、人工知能の発展を促進します。
【AiBase要約:】
🌟 TimesFM2.0はGoogleが発表した新しい時系列予測モデルで、時系列予測の精度向上に焦点を当てています。
🔧 最大2048個の時間点の予測をサポートし、任意の予測時間範囲を処理できます。
📊 ユーザーは異なる時系列の特徴に応じて予測頻度を自由に選択でき、予測の柔軟性を高めます。
詳細はこちら:https://huggingface.co/google/timesfm-2.0-500m-pytorch
6、深圳の新型ヒューマノイドロボットSE01が海外で人気爆発、ネットユーザー「これはsoraで生成されたものではないのか?」と驚きの声
深圳市が発表したヒューマノイドロボットSE01は、人間に近い歩行と柔軟性から急速に人気を集め、海外で大きな話題となっています。時折転倒することもありますが、その技術背景と市場性から、消費者は未来のロボット技術に大きな期待を抱いています。衆擎ロボット公司は、高度な技術と市場ニーズの融合を目指しており、強力な市場競争力を示しています。
【AiBase要約:】
🚶♂️ SE01ロボットは優れた歩行、速度、安定性を備え、モデルウォーキングのように歩きます。
💰 生産コストは10万元に抑えられ、予想価格は15万元で、将来的には小規模な商用化を目指しています。
📸 インテルRealSense深度カメラと360度レーザーレーダーを搭載し、優れた環境認識と障害物回避能力を備えています。
7、NeuralSVG:テキストから編集可能なベクターグラフィックを生成
NeuralSVGは、テキストプロンプトを使用してベクターグラフィックを生成する革新的な方法であり、アーティストやデザイナーに柔軟で効率的なツールを提供します。その核心は、陰的ニューラル表現と分数蒸留サンプリング技術にあり、多階層構造のSVGファイルを生成できます。ユーザーは生成プロセス中に色、背景、比率を動的に調整でき、デザインの個性と柔軟性を大幅に向上させます。
【AiBase要約:】
🖼️ NeuralSVGはテキストプロンプトから多階層構造のベクターグラフィックを生成できます。
🎨 ユーザーは生成されたグラフィックの色や比率を動的に調整して、個性的なデザインを実現できます。
✏️ このシステムは、異なる筆画数のスケッチを生成でき、強力な適応性を示しています。
詳細はこちら:https://sagipolaczek.github.io/NeuralSVG/
8、オープンソースのアクション予測モデルViTPose:各フレームのアクションを予測し、アノテーションを行うことができます
ViTPoseは、人体姿勢認識に特化したオープンソースのアクション予測モデルです。その独特な点は、複雑な畳み込みニューラルネットワークではなく、シンプルで効率的なビジョンTransformer技術を採用していることです。モデル構造がシンプルで調整が容易なため、性能と速度のバランスを取ることができます。ViTPoseは複数のデータセットで優れたパフォーマンスを示しており、多くの複雑なモデルを凌駕する結果も出ており、シンプルなモデルの大きな可能性を示しています。
【AiBase要約:】
🦵 ViTPoseは純粋なビジョンTransformerアーキテクチャを使用しており、モデル構造を簡素化し、効率を向上させています。
📈 モデルは必要に応じてサイズを調整でき、異なるタスクやデータセットに柔軟に対応できます。
🌍 ViTPoseはMS COCOなどのデータセットで優れたパフォーマンスを示し、強力な姿勢推定能力を備えています。
詳細はこちら:https://huggingface.co/spaces/hysts/ViTPose-transformers
9、OpenAIのクローラーによる頻繁なデータ収集が原因で、人体3Dモデルウェブサイトがダウン
最近、ウクライナの3DモデルウェブサイトTrilegangersが深刻なトラフィック攻撃を受けました。この事件は、OpenAIのクローラーGPTBotが同ウェブサイトのデータを頻繁に収集したことが原因です。Trilegangersは利用規約で無許可のデータ収集を禁止していましたが、robots.txtファイルが正しく設定されていなかったため、サーバーの負荷が過剰になり、ウェブサイトがダウンしました。この危機に対処するため、Trilegangersはrobots.txtファイルの変更とCloudflareによるクローラーアクセス遮断措置を講じ、ウェブサイトの正常な運用を確保しました。
【AiBase要約:】
🛑 TrilegangersウェブサイトはOpenAIのGPTBotによる頻繁なデータ収集によりダウンし、サーバーに過剰な負荷がかかりました。
🔧 ウェブサイトでrobots.txtファイルが正しく設定されていなかったため、クローラーのアクセスを効果的に阻止できず、トラフィック攻撃が発生しました。
🌐 Trilegangersはrobots.txtファイルの正しい設定とCloudflareによるクローラー遮断措置を講じ、ウェブサイトの正常な運用を確保しました。
10、LGがヒューマノイドロボット市場への参入を発表、サブスクリプション型のAIエージェントQ9の発売を計画
LGエレクトロニクスはCES2025で、ヒューマノイドロボットの研究開発への投資を拡大し、家庭の生産性を向上させることを目的としたAIエージェントQ9を搭載したヒューマノイドロボットを発売する計画を発表しました。LGはまた、マイクロソフトと戦略的パートナーシップを結び、家庭、自動車、ホテルなどの分野におけるAI技術の応用を推進しています。テスラなどの競合他社に対し、LGエレクトロニクスは技術革新とユーザーエクスペリエンスの向上を通じて、この分野で地位を確立することを目指しています。
【AiBase要約:】
🤖 LGエレクトロニクスは2025年にAIエージェントQ9を搭載したヒューマノイドロボットを発売する計画で、家庭の生産性向上を目指しています。
🤝 LGはマイクロソフトと戦略的パートナーシップを結び、家庭、自動車、ホテルなど様々な分野でのAI技術の応用を推進しています。
🏃♂️ ヒューマノイドロボット競争は激化しており、テスラなどの競合他社も積極的に関連技術を開発しており、市場は広がりを見せています。
11、OpenAI、GoogleなどのAI大手企業が、クリエイターの未公開動画を購入、1分あたり最大4ドル
最近、OpenAIやGoogleなどのテクノロジー大手企業が、AIモデルのトレーニングに使用するため、クリエイターの未公開動画を1分あたり1~4ドルで直接購入しています。この傾向は、クリエイターに新たな収益源をもたらすだけでなく、市場での激しい競争も引き起こしています。4Kやドローン撮影などの高品質な動画素材はより高い価格で取引され、一般的な未使用の動画は比較的低い価格で取引されています。
【AiBase要約:】
💰 OpenAIやGoogleなどの企業は、クリエイターの未公開動画を1分あたり1~4ドルで購入しており、特に高品質な素材にはより高い価格を付けています。
📹 契約には保護条項が含まれており、AI企業がクリエイターのデジタルコピーを作成できないようにし、クリエイターはAIによる公開動画の使用権を管理できます。
🌐 この傾向はコンテンツクリエイターに予想外の収益をもたらしており、多くの未公開素材が売却によって収益化されています。
12、四省庁:人工知能のトレーニング、データアノテーション関連の職業国家職業基準を制定(改定)
最近、国家発展改革委員会などの省庁は、データアノテーション産業の高品質な発展を促進するための実施意見を発表しました。これは、データアノテーション産業の専門化と知能化を推進し、人工知能の革新と応用を促進することを目的としています。この政策は人材の導入と育成、産学連携の推進、データアノテーション分野の職業資格と技能等級の連携を強調し、2027年までに産業の規模拡大とイノベーション能力の著しい向上(年平均複合成長率20%超)を目指しています。
【AiBase要約:】
🎓 高度な専門人材を育成し、国家職業基準を制定することで、データアノテーション業界の専門性を高めます。
📈 2027年までにデータアノテーション産業の規模を拡大し、年平均複合成長率を20%以上にすることを目指しています。
🤝 産業連携を強化し、特に行政サービスや都市管理分野における公共データアノテーションのニーズを促進します。