OpenAIがAGI評価基準を初公開：ChatGPTはレベル1に留まる

AIbase

公開日AIニュース · 1 分で読めます · Jul 12, 2024

890

ブルームバーグの報道によると、OpenAI社は、自社の大規模言語モデルが人工汎用知能（AGI）においてどの程度進歩しているかを追跡するための内部指標を作成しました。この取り組みは、OpenAIのAGI分野における野心を示すだけでなく、AI開発の新たな評価基準を業界に提供するものとなります。

この指標は5つのレベルに分けられています。1. レベル1：ChatGPTなどの現在のチャットボットがこのレベルに該当します。2. レベル2：博士号レベルの基本的な問題を解決できるシステム。OpenAIは、このレベルに近づいていると主張しています。3. レベル3：ユーザーに代わって行動を起こすことができるAIエージェント。4. レベル4：新たなイノベーションを生み出すことができるAI。5. レベル5：組織全体の業務を実行できるAIで、AGI実現の最終段階と見なされています。

OpenAIは以前、AGIを「経済的に価値のあるほとんどのタスクにおいて人間を凌駕する、高度に自律的なシステム」と定義していました。この定義は、OpenAIの開発方向にとって非常に重要であり、OpenAIの構造と使命はAGIの実現を中心としています。

OpenAI、人工知能、AI

しかし、AGI実現のタイムラインについては専門家の意見が分かれています。OpenAIのCEOであるSam Altman氏は、2023年10月にAGIの実現まで「あと5年」と述べていました。しかし、AGIが実現したとしても、数十億ドル規模の計算資源が必要となるでしょう。

注目すべきは、この評価基準の発表が、OpenAIがロスアラモス国立研究所と協力して、GPT-4などの高度なAIモデルを生物科学研究に安全に利用する方法を探求すると発表した時期と重なっていることです。この協力は、将来、様々なAIモデルのテストに使用できる安全性の評価基準などを米国政府に提供することを目的としています。

OpenAIは、モデルをこれらの内部レベルにどのように割り当てるかについての詳細情報を提供することを拒否していますが、ブルームバーグの報道によると、最近、経営陣はGPT-4 AIモデルを使用した研究プロジェクトを発表し、それが人間のような推論能力の新スキルをいくつか示していると主張しています。

AGIの進捗状況を定量化する方法によって、AI開発のより厳格な定義が可能になり、主観的な解釈を避けることができます。しかし、同時に、AIの安全性と倫理に関する懸念も引き起こしています。今年5月、OpenAIは安全チームを解散し、元従業員の中には、同社の安全文化が製品開発に取って代わられたと主張する者もいますが、OpenAIはこの主張を否定しています。

アップルのAIニュース要約機能が虚偽情報拡散で物議を醸す

アップル社が最近発表したAIニュース要約機能が、速報ニュースの要約において重大な誤りを繰り返し、ユーザーに大量の虚偽情報が伝わる事態を引き起こしている。この機能の発表以来、多くの報道機関やユーザーから、アップルの技術が未成熟であり、正確な情報を効果的に提供できないとして強い反発を受けている。ワシントンポスト紙のテクノロジーコラムニスト、ジェフリー・ファウラー氏がソーシャルメディアで、アップルのAIがニュース要約において事実を歪めたと投稿したと報じられている。

元Twitter幹部が開発したAIニュースアシスタントParticle：AIでニュース閲覧体験を刷新、1530万ドルの資金調達

現在のメディア業界がAIに対して慎重な姿勢をとる中、ParticleというAIニュース閲覧アプリがその状況を変えようとしています。元Twitterのエンジニアが開発したこのアプリは、ユーザーがニュースをより深く理解するのを支援するとともに、従来のメディア機関とのウィンウィン関係を模索しています。Particleは、元Twitterプロダクトマネジメント上級ディレクターのSara Beykpour氏と、元Twitterおよびテスラの上級エンジニアであるMarcel Molina氏によって共同設立されました。同社は、

日本のスーパー、AIで従業員の笑顔を監視　ネット上で「大げさだ」と批判の声

日本のイオン系のスーパーマーケットが、AIシステム「Smile-Kun」を使って従業員の笑顔を監視していることが明らかになった。従業員の笑顔や声の分析を通じて接客スキル向上を目指しているという。システムは特定のあいさつ方法を要求し、450個の微表情のポイントで100点満点で採点、リアルタイムでフィードバックする。さらに、音量や滑らかさ、トーンについても分析し、改善点を提案する。従業員の反応では笑顔の割合が大幅に増加したという。しかし、この取り組みは物議を醸しており、一部のネットユーザーからは従業員の個性や感情を過度に数値化しており、真心のこもったサービスとは程遠いとの批判が出ている。批判意見では、上下関係や

マイクロソフト研究所、AIフレームワークE5-Vを発表：テキストペアの単一モーダル学習でマルチモーダル学習を簡素化、コスト削減

マイクロソフト研究所と北京航空航天大学の研究チームは、マルチモーダル大規模言語モデル（MLM）開発における課題解決を目指し、高効率なマルチモーダル埋め込みフレームワークE5-Vを発表しました。この革新的なフレームワークは、単一モーダル学習によってマルチモーダル学習プロセスを簡素化し、従来のモデルに見られた独立したエンコーダーへの依存と、それに伴う入力統合の非効率性を克服します。E5-Vはテキストと画像情報を統合することでトレーニングコストを削減し、テキスト-画像検索、画像検索など、複数の複雑なタスクにおいて優れた性能を示しました。特にゼロショット学習において…

AIニュース