STROJNO UČENJE VODENJA AGENTA Z NAMENOM IZOGIBANJA OVIR V 2-D OKOLJU

Imamo agenta, ki se s konstantno hitrostjo giblje v okolju z ovirami. Agentu so na voljo podatki iz senzorjev (npr. oddaljenost do ovir, velikost ovir, ipd), krmilimo pa ga z ukazi "levo" in "desno". Okolje in agent sta simulirana. Namen naloge je na osnovi primerov vodenja in zapisov "stanje-akcija" konstruirati model vodenja agenta, katerega namen je izogibanje oviram. Za konstrukcijo modela se uporabijo različni sistemi strojnega ucenja (odličitvena/regresijska drevesa, Bayes, ipd.). Specifični cilji naloge so: Nalogo je moč razširiti s kompleksnejšim okoljem (premikajoče se ovire), razširitvijo akcij agenta (regulacija hitrosti, skakanje, ipd), ter razširitvijo opisa okolja, ki je na voljo agentu (večje število in kompleksnejši senzorji). Možna je tudi razširitev naloge v smislu odkrivanja in uporabe izvedenih atributov (konstruktivna indukcija).

Mentor:
Blaž Zupan
Odsek za Inteligentne Sisteme
IJS
EMail: blaz.zupan@ijs.si

Opomba:
Nalogo je predlagal in jo bo izdelal študent Aleks Jakulin.