Selbst Top-LLMs schwächeln bei neuem Benchmark für KI-Agenten

25. August 2025 um 09:04

Forscher von Salesforce AI Research haben mit MCP-Universe einen neuen Benchmark entwickelt, der die Leistung von KI-Agenten besser beurteilen soll als bestehende Ansätze.

OCCT Diagnosetool jetzt für Linux verfügbar

Linuxnews.de

Von: Ferdinand

23. April 2025 um 07:48

Nach über 20 Jahren OCCT für Windows hat der Hersteller OCBASE eine Linux-Version freigegeben, die alle Funktionen der Windows-Edition grafisch ansehnlich aufbereitet bietet.

Quelle

Mozilla bringt Benchmark für lokale KI

Linux-Magazin

Von: Ulrich Bantle

08. April 2025 um 07:53

Mozilla hat im Rahmen der Veröffentlichung von Llamafile 0.9.2 mit LocalScore auch eine erste Version des Benchmarks für lokale KI vorgestellt.

Neuer Benchmark lässt alle LLMs alt aussehen

Linux-Magazin

Von: Jens-Christoph Brendel

04. Februar 2025 um 11:06

Ein kürzlich veröffentlichter neuer Benchmark unter dem Titel "Humanity's Last Exam" lässt alle heutigen Sprachmodelle verzweifeln.

Lese-Ansicht