STROJNO UČENJE VODENJA AGENTA Z NAMENOM IZOGIBANJA OVIR V 2-D
OKOLJU
Imamo agenta, ki se s konstantno hitrostjo giblje v okolju z
ovirami. Agentu so na voljo podatki iz senzorjev (npr. oddaljenost do
ovir, velikost ovir, ipd), krmilimo pa ga z ukazi "levo" in
"desno". Okolje in agent sta simulirana. Namen naloge je na osnovi
primerov vodenja in zapisov "stanje-akcija" konstruirati model vodenja
agenta, katerega namen je izogibanje oviram. Za konstrukcijo modela se
uporabijo različni sistemi strojnega ucenja (odličitvena/regresijska
drevesa, Bayes, ipd.). Specifični cilji naloge so:
- izdelava simulatorja,
- konstrukcija modela za vodenje agenta z izbranimi metodami
strojnega učenja (odličitvena/regresijska drevesa, Bayes, ipd.)
iz primerov vodenja,
- študij "kvalitete" naučenih modelov,
- interpretacija teh modelov,
- študij izbora potrebnih in zadostnih atributov, ki so potrebni za
vodenje.
Nalogo je moč razširiti s kompleksnejšim okoljem (premikajoče se
ovire), razširitvijo akcij agenta (regulacija hitrosti, skakanje,
ipd), ter razširitvijo opisa okolja, ki je na voljo agentu (večje
število in kompleksnejši senzorji). Možna je tudi razširitev naloge v
smislu odkrivanja in uporabe izvedenih atributov (konstruktivna
indukcija).
Mentor:
Blaž Zupan
Odsek za Inteligentne Sisteme
IJS
EMail: blaz.zupan@ijs.si
Opomba:
Nalogo je predlagal in jo bo izdelal študent Aleks Jakulin.