web Autonomne.cz

odkaz na homepage

Wayve představuje generativní model světa GAIA-3

Britská společnost Wayve představila novou verzi generativního modelu světa s názvem GAIA-3. Model obsahuje 15 miliard parametrů, tedy zhruba dvojnásobek oproti svému předchůdci GAIA-2. Tyto modely jsou využívány pro hodnocení a validaci AI modelů pro autonomní řízení, skrze realistické simulace a obohacení rozmanitosti dat. GAIA-3 zvládne vytvářet simulace ve značně větším měřítku a rozlišení, čímž podpoří spolehlivost end-to-end systémů autonomního řízení, jejichž vývojem se Wayve zabývá.

Pro vývoj AI modelů pro autonomní řízení je nutné velké množství dat, z nichž se modely učí. Avšak získat dostatečně rozsáhlé a rozmanité množství dat je vskutku netriviální úkol. Ne všechna data totiž lze prakticky nasbírat v reálném prostředí na silnicích. Některé okrajové scénáře (tedy situace, ke kterým dochází jen velmi zřídka) nelze spolehlivě zaznamenat či nasimulovat. Případně by to bylo nesmírně časově a finančně nákladné, a v případě specifických situací (třeba nehod a riskantních situací) dokonce nebezpečné a neetické. Proto se často využívají data ze simulovaného prostředí. Problémem však může být nedostatečný realismus simulovaných dat, a chování modelu v reálných podmínkách potom nemusí být odpovídající.

Ilustrativní obrázek. (Zdroj: Copilot.)

Generativní modely světa (anglicky: „generative world model“) nabízejí řešení. Narozdíl od člověkem vytvořené simulace s pevně danými parametry se učí z dat senzorů vytvářet vnitřní reprezentaci prostředí a dynamicky vytvářet nové stavy podle chování agenta (Tím by v tomto případě bylo virtuální auto řízené AI modelem). Výhodou potom je, že AI modely lze trénovat ve virtuálním prostředí bez nutnosti náročného testování v reálném světě. Model GAIA-3 se pyšní velmi vysokou úrovní realismu, a také rozmanitostí prostředí, které dokáže nasimulovat.

V začátku této aktuality padla zmínka o tzv. end-to-end modelech. O co se vlastně jedná? O Wayve a jejich vizi pro autonomní řízení jsme na Autonomně.cz psali již několikrát. Shrneme-li to zjednodušeně, end-to-end model řeší celý úkon řízení jako celek typicky pomocí jedné velké neuronové sítě. Vstupní data (jako třeba obraz z kamery, nebo bodová mračna z lidaru) vstoupí do sítě, a ta vrací rovnou plány trajektorie a příkazy ovládající vozidlo. Přeskočí se tak různé mezikroky klasického paradigmatu (vnímání -> mapování -> plánování -> ovládání), které převládá u jiných výrobců. Wayve si od end-to-end přístupu slibuje větší efektivitu, snazší škálovatelnost a schopnost přizpůsobit se různému prostředí. End-to-end přístup bývá ale kritizováno pro netransparentnost. Funguje totiž jako černá skříňka, jejíž vnitřní fungování nelze snadno vyhodnotit. Nástroj jako GAIA-3 je proto pro hodnocení a validaci těchto end-to-end modelů velmi zásadní.


 
Úvodní ilustrační foto. (Zdroj: Copilot)