2025-02-26 09:56:15.AIbase.
92% der britischen Studenten nutzen KI für Hausaufgaben – neue Herausforderungen für die Hochschulbewertung!
2025-02-20 09:14:14.AIbase.
Rangliste der Halluzinationen großer Sprachmodelle: Gemini 2.0 Flash mit den niedrigsten Halluzinationen
2024-12-19 17:47:00.AIbase.
CompassArena, die Bewertungsplattform für große Modelle, erhält ein Upgrade mit der neuen Judge Copilot-Funktion
2024-12-11 09:30:05.AIbase.
Yelp veröffentlicht neue KI-Funktion zur schnellen Zusammenfassung von Kundenbewertungen und Optimierung der Restaurantsuche
2024-11-15 14:45:38.AIbase.
KI-Showdown in Minecraft! Claude-Neubauversion beeindruckt das gesamte Netz
2024-11-15 09:55:02.AIbase.
Google Gemini Exp 1114: Sensationsauftritt! Übertrifft GPT-4 im ersten Vergleich und erreicht Spitzenpositionen in mehreren Leistungsbewertungen
2024-11-07 15:17:20.AIbase.
FTC greift ein! Online-Bewertungsplattform Sitejabber wegen gefälschter Produktbewertungen angeklagt
2024-10-22 11:55:45.AIbase.
Grammarly kündigt Tool zur Messung des ROI von KI-Investitionen an
2024-10-15 16:57:33.AIbase.
PDFtoChat Technologiebewertung: Ein KI-basiertes PDF-Informationssuchsystem
2024-09-30 14:08:02.AIbase.
FlagEval Debate: Das weltweit erste chinesische KI-Modell-Debatten-Plattform von BAAI
2024-08-27 09:19:17.AIbase.
US-Medienkonzern Gannett schließt Produktbewertungswebsite Reviewed – Vorwürfe der Verwendung von KI-Bewertungen
2024-08-16 14:03:40.AIbase.
Geekbench präsentiert neuen KI-Benchmark zur Leistungsbewertung von Geräten bei KI-Aufgaben
2024-08-09 09:16:52.AIbase.
OpenAI stuft sein neuestes GPT-4o-Modell als "mittel" im Risiko ein
2024-08-07 14:14:43.AIbase.
Meta präsentiert den „Selbstlern-Evaluator“: Modellbewertung für NLP ohne manuelle Annotationen, übertrifft GPT-4 und andere gängige LLMs
2024-07-23 08:09:28.AIbase.
Baidu Intelligent Cloud präsentiert die Finanz-KI-Anwendung „Zhijin“ mit Funktionen wie der intelligenten Vermögensbewertung
2024-07-02 10:38:02.AIbase.
Anthropic startet Programm zur Förderung der Entwicklung neuer KI-Benchmarks
2024-06-27 10:36:23.AIbase.
ChatGPT-generierte Prüfungsantworten übertreffen Studenten und täuschen Professoren aus
2024-06-27 09:28:40.AIbase.
Hugging Face aktualisiert die Ranglistenbewertungsregeln für KI-Modelle – eine neue Phase der KI-Bewertung
2024-06-20 11:20:15.AIbase.
Alibaba Qwen2-72B führt die HELM-Rangliste an: Übertrifft Llama3-70B
2024-03-07 03:52:56.AIbase.