Open AI open-sourcovala své OpenAI Evaly, jejich framework pro automatizované hodnocení výkonnosti AI modelů (např. GPT-4), aby mohl kdokoli nahlásit nedostatky v jejich modelech a přispět tak k jejich dalšímu zlepšování. Zatímco záběr evalů je široký, naše pracovní skupina by se věnovala výhradně testování modelů z hlediska přesvědčování, manipulace a situačního povědomí. Nové evaly budeme […]