ja
AI製品ランキング
每月不到10元,就可以无限制地访问最好的AIbase。立即成为会员
ホーム
AIニュース
AIデイリー
マネタイズガイド
AIチュートリアル
AIツールナビ
AI製品ライブラリ
ja
AI製品ランキング
グローバルAI製品の動向を検索
グローバルAI情報を検索して、AIの新しい機会を発見
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
タイプ :
ニュース
製品アプリケーション
マネタイズ事例
AIチュートリアル
2025-02-24 09:09:34
.
AIbase
.
15.6k
OpenAIの最新研究が明らかにした:最先端のAIは依然としてコーディングの問題を解決することができない
最近、OpenAIの研究者は新たに発表した論文の中で、現在のAI技術が相当進んでいるにもかかわらず、これらのモデルが人間のプログラマーと同等には達していないことを認めました。OpenAIのCEO、サム・アルトマンは、今年の年末までにはAIが「初級」ソフトウェアエンジニアに勝ると予想していましたが、研究結果はこれらのAIモデルが依然として重大な課題に直面していることを示しています。画像の出典:写真はAIによって生成され、画像の権利を持つサービスプロバイダーMidjourneyによる研究中に使用されました。
2025-02-20 10:37:18
.
AIbase
.
15.5k
OpenAIの最新ベンチマーク:AIのプログラミング能力は人間の4分の1、限界も明らかに
OpenAIは先日、AIのプログラミング能力を評価する重要なレポートを発表しました。100万ドル相当の実開発プロジェクトを通じて、AIがソフトウェア開発分野でどのような現状にあるのかを明らかにしています。SWE-Lancerと呼ばれるこのベンチマークテストは、Upworkから集めた1400件の実プロジェクトを網羅し、AIの直接開発とプロジェクト管理の2つの分野におけるパフォーマンスを包括的に評価しました。テストの結果、最高性能を達成したAIモデルであるClaude3.5Sonnetは、コーディングタスクでの成功率が26.2%、プロジェクト管理決…
2025-02-18 16:55:26
.
AIbase
.
15.5k
OpenAI、SWE-Lancerベンチマークを発表:現実世界のフリーランスソフトウェアエンジニアリングにおけるモデルのパフォーマンスを評価
ソフトウェアエンジニアリングの分野では、課題が進化するにつれて、従来のベンチマーク手法では不十分になっています。フリーランスのソフトウェアエンジニアリング業務は複雑で多様であり、単なる孤立したコーディングタスクだけではありません。フリーランスのエンジニアは、コードベース全体を処理し、複数のシステムを統合し、複雑な顧客のニーズに応える必要があります。従来の評価方法は通常、単体テストに重点を置いており、フルスタックのパフォーマンスとソリューションの実際の経済的影響を十分に反映することはできません。そのため、より現実的な評価方法の開発が不可欠です。そこでOpenAIは、SWE-Lan…