AIニュース

世界のAIイノベーションの瞬間をお見逃しなく

AIデイリー

毎日の3分AI業界トレンド

AIタイムライン

AI業界のマイルストーン

Alハードウェアです

すべてのAIハードウェアをリストアップします。

AIマネタイズガイド

画像コレクション

AI画像生成マネタイズ事例

ビデオコレクション

AIビデオ生成マネタイズ事例

オーディオコレクション

AIオーディオ生成マネタイズ事例

コンテンツコレクション

AIコンテンツ作成マネタイズ事例

AIチュートリアル

AIプロダクトランキング

AIウェブサイトの総訪問数ランキングを表示

AIトラフィック成長ランキング

トラフィックによる最も急速に成長しているAIウェブサイトを追跡

AIトラフィック減少ランキング

トラフィックが大幅に減少しているAIウェブサイトに焦点を当てる

AI週間ランキング

AIウェブサイトの週間訪問数ランキングを表示

AIオープンソースプロジェクトライブラリ

概要

GitHubの人気のあるAIオープンソースプロジェクトの概要

プロダクトライブラリツールナビゲーション

大失望！OpenAIの新モデルo1を実測：初歩的なミス連発、文字計算すら間違える

AIbase基地

公開日AIニュース · 1 分で読めます · Sep 14, 2024

293

先日、OpenAIは「ストロベリー」というコードネームで知られていた、正式名称「o1-preview」のAIモデルを発表しました。

OpenAIは、この新しいモデルが物理学、化学、生物学などの高度な基準タスクにおいて、博士課程の学生に劣らない性能を示すと約束していました。しかし、初期テストの結果は、このAIが人間の科学者やプログラマーに取って代わるという目標には程遠いことを示しています。

ソーシャルメディアでは、多くのユーザーが「OpenAI o1」AIとのインタラクション体験を共有しており、その結果、このモデルは基本的なタスクでも依然として不十分なパフォーマンスを示していることが明らかになっています。

例えば、INSA Rennesの研究者Mathieu Acher氏は、OpenAI o1がチェスのパズルを解く際に、頻繁に不正な手を提案することを発見しました。

一方、Meta AIの科学者Colin Fraser氏は、羊を川を渡らせるという簡単な言葉のパズルにおいて、このAIが正しい答えを放棄し、論理の通らないでたらめな回答を提示したと指摘しています。

さらに、OpenAIがデモに使用した論理パズルにおいても、ストロベリーに関する質問に対してユーザーは異なる回答を得ており、あるユーザーはモデルの誤答率が75％に達したことを発見しました。

それだけでなく、一部のユーザーは、この新しいモデルが「strawberry」という単語の中に含まれる文字「R」の数を数えることさえ頻繁に間違えることを報告しています。

OpenAIは発表時に、これは初期段階のモデルであり、ウェブブラウジングやファイルアップロードなどの機能はまだ備わっていないと述べていましたが、このような基本的なミスは驚きです。

改善のため、OpenAIは新しいモデルに「思考連鎖」プロセスを導入し、OpenAI o1を以前のGPT-4oモデルから大きく差別化しました。この方法により、AIは答えを出す前に何度も推敲することができますが、そのため応答時間が長くなるというデメリットもあります。

あるユーザーは、このモデルが言葉のパズルの答えを出すのに92秒もかかったにもかかわらず、結果は依然として間違っていたことを発見しました。

OpenAIの研究科学者Noam Brown氏はこれについて、現在の応答速度は遅いものの、将来のバージョンではより長い時間をかけて思考し、画期的な問題に新たな知見を提供できると期待していると述べています。

しかし、著名なAI評論家Gary Marcus氏はこれに対して懐疑的な見方を示し、長時間処理すれば必ず超越的な推論能力が得られるとは限らないと主張しています。彼は、AI技術は発展を続けているものの、現実世界の研究と実験は依然として不可欠であると強調しています。

このように、OpenAIの新しいAIモデルは実際の使い方において様々な面で期待外れであり、AI技術の将来の発展に関する議論を引き起こしています。

要点：
🌟 最近、OpenAIは新しいAIモデル「ストロベリー」を発表し、複雑なタスクで博士課程の学生に匹敵する性能を謳っています。
🤖 多くのユーザーは、このAIが不正な手を提案したり、簡単なパズルを間違えたりするなど、基本的なタスクで頻繁にミスをすることを発見しました。
💬 OpenAIは、このモデルはまだ開発中であることを認めていますが、長時間思考すれば推論能力が向上するとは限らず、多くの基本的な問題が未解決のままです。

OpenAI o1-preview AIモデルイチゴ

この記事はAIbaseデイリーからのものです

【AIデイリー】へようこそ！ここは、毎日人工知能の世界を探求するためのガイドです。毎日、開発者に焦点を当て、技術トレンドを洞察し、革新的なAI製品アプリケーションを理解するのに役立つ、AI分野のホットなコンテンツをお届けします。

—— AIbase デイリーグループによって作成

OpenAIがgpt-image-1 APIを発表、高画質画像生成機能を正式公開

OpenAIはgpt-image-1 APIを正式にリリースし、注目の高画質画像生成機能を開発者向けに公開しました。AIbaseの情報によると、このAPIは高精細な画像生成、多様なビジュアルスタイル、強力な世界知識統合能力を備えており、コミュニティでは世界最強の「画像生成ツール」として評価されています。発表のニュースはAI開発者やクリエイティブコミュニティで大きな反響を呼び、関連ドキュメントはOpenAIの公式ウェブサイトとPlaygroundプラットフォームで公開されています。主な機能：高精細と多様なスタイルの生成

Apr 24, 2025

OpenAI、2029年売上高1250億ドル、2030年月間アクティブユーザー30億人を予測

OpenAIは最近、将来の収益に関する予測を発表し、2029年までに総収益が1250億ドルに達すると予測しています。AIエージェント事業とチャネル収益が主な推進力となります。予測によると、AIエージェント事業は総収益の約4分の1を占め、収益は290億ドルに達すると予想され、チャネル収益は250億ドルに達すると予想されています。画像引用元:画像はAIによって生成され、画像ライセンス提供サービスMidjourneyを通じて提供されています。ChatGPTの成功に伴い、OpenAIの…

Apr 24, 2025

GPT-4.1モデル、整合性と安定性に疑問の声：懸念の高まり

Apr 24, 2025

OpenAI、ChatGPTの新しい画像生成機能APIを発表：開発者はAI描画機能を簡単に統合可能に

OpenAIは先日、最新の画像生成機能をAPIを通じて開発者に公開し、この高度な技術を様々なアプリケーションやサービスに統合できるようにすると発表しました。このニュースは、特に画像処理や創作分野において、開発者にとって新たな機会をもたらすことは間違いありません。新たに発表された画像生成モデルの名前は「gpt-image-1」で、ChatGPTの画像生成技術を基盤としています。3月末にこの機能が公開されて以来、ユーザーはリアルなジブリ風の画像などを作成することが可能です。

Apr 24, 2025

OpenAIの新GPT-4.1モデル、アライメントの低下に直面

OpenAIは最近、最新AIモデルGPT-4.1を発表し、指示実行における優れた性能を謳っています。しかしながら、複数の独立したテストで、GPT-4.1は信頼性、つまりアライメントの面で、前モデルのGPT-4.0と比べて低下していることが示されました。通常、OpenAIは新モデル発表時に安全評価の結果を含む詳細な技術報告書を公開しますが、今回はその慣例に従わず、GPT-4.1は「最先端」モデルではないと説明しています。

Apr 24, 2025

Le Washington Post et OpenAI s'associent pour que ChatGPT fournisse des résumés de qualité aux utilisateurs

Apr 23, 2025

OpenAI：もしGoogleがChromeの売却を強制された場合、買収を検討！

最近のワシントンD.C.で行われたGoogleに対する反トラスト訴訟の公判で、OpenAIの幹部Nick Turley氏は注目すべき発言をしました。同氏は、裁判所が検索市場の競争回復のためにGoogleがChromeブラウザの売却を命じる判決を下した場合、OpenAIはChromeブラウザの買収を検討する意向があると述べました。この発言は、OpenAIが検索機能を重視していること、そして同社の将来的な野心を示すものです。Turley氏は、検索…

Apr 23, 2025

OpenAI幹部、裁判所証言で明かす：グーグルがChrome売却を余儀なくされた場合、買収を検討

Apr 23, 2025

司法省、グーグルにChromeの売却を迫る可能性　OpenAIが買収意向を示唆

Apr 23, 2025

OpenAI、macOS向けChatGPTの新機能を発表　プログラミングと検索の効率化を実現

Apr 22, 2025

AIニュース

AIデイリー

AIタイムライン

Alハードウェアです

最新事例

画像コレクション

ビデオコレクション

オーディオコレクション

コンテンツコレクション

最新チュートリアル

AIプロダクトランキング

AIトラフィック成長ランキング

AIトラフィック減少ランキング

AI週間ランキング

アメリカ合衆国

中国

インド

ブラジル

画像生成

パーソナルアシスタント

キャラクター生成

ビデオ生成

AIプロジェクトランキング

AIプロジェクト成長ランキング

AI開発者ランキング

AI組織ランキング

Deepseek

TTS

LLM

ChatGPT

概要

大失望！OpenAIの新モデルo1を実測：初歩的なミス連発、文字計算すら間違える

AIbase基地

この記事はAIbaseデイリーからのものです

関連AIニュースの推奨

OpenAIがgpt-image-1 APIを発表、高画質画像生成機能を正式公開

OpenAI、2029年売上高1250億ドル、2030年月間アクティブユーザー30億人を予測

GPT-4.1モデル、整合性と安定性に疑問の声：懸念の高まり

OpenAI、ChatGPTの新しい画像生成機能APIを発表：開発者はAI描画機能を簡単に統合可能に

OpenAIの新GPT-4.1モデル、アライメントの低下に直面

Le Washington Post et OpenAI s'associent pour que ChatGPT fournisse des résumés de qualité aux utilisateurs

OpenAI：もしGoogleがChromeの売却を強制された場合、買収を検討！

OpenAI幹部、裁判所証言で明かす：グーグルがChrome売却を余儀なくされた場合、買収を検討

司法省、グーグルにChromeの売却を迫る可能性 OpenAIが買収意向を示唆

OpenAI、macOS向けChatGPTの新機能を発表 プログラミングと検索の効率化を実現

司法省、グーグルにChromeの売却を迫る可能性　OpenAIが買収意向を示唆

OpenAI、macOS向けChatGPTの新機能を発表　プログラミングと検索の効率化を実現