LLMs lügen schlecht
Forscher von OpenAI haben untersucht, inwiefern heutige Reasoning-Modelle bereits in der Lage sind, ihre Gedankengänge zu verschleiern, wenn sie wissen, dass sie überwacht werden.
Forscher von OpenAI haben untersucht, inwiefern heutige Reasoning-Modelle bereits in der Lage sind, ihre Gedankengänge zu verschleiern, wenn sie wissen, dass sie überwacht werden.
In einer seltenen firmenübergreifenden Veröffentlichung fordern Wissenschaftler von Anthropic, OpenAI, Google DeepMind, Meta und verschiedener Forschungsinstitute eine bessere Überwachbarkeit der…