Kategorie zaměstnání: Analytics

Vývoj evaluací velkých jazykových modelů

Vývoj evaluací velkých jazykových modelů

Na základě komunikace s odborníky na bezpečnost umělé inteligence se snažíme přispět k vývoji evaluací (tzv. evalů) velkých jazykových modelů (LLMs). Naše pracovní skupina se věnuje testování modelů z hlediska jejich tendence či schopnosti manipulovat. Jak to vypadá? Více podrobností najdete v tomto dokumentu. Pro koho to je? Hlavní částí je vymýšlení smysluplných sérií promptů, […]