
Pastaraisiais metais kompiuterių mokslininkai sukūrė vis sudėtingesnius algoritmus, skirtus nukreipti robotų agentų judėjimą. Tai apima modelio nuspėjamosios kontrolės (MPC) strategijas, kurios naudoja agento dinamikos modelį, kad optimizuotų jo artėjimą prie konkretaus tikslo ir tuo pat metu atitiktų tam tikrus apribojimus (pavyzdžiui, nepataikoma į kliūtis).
Nuspėjamojo valdymo strategijų modeliai ir dirbtinių neuronų tinklų technologijos
Real-Time Neural MPC yra sistema, kuri integruoja sudėtingas modelių architektūras, pagrįstas dirbtiniais neuroniniais tinklais (ANN) į MPC sistemą, skirtą mobiliesiems robotams (t. y. kvadrotoriams-dronams). Neseniai jį sukūrė Miuncheno technikos universiteto ir Ciuricho universiteto mokslininkai. Ši idėja, apie kurią pranešta IEEE Robotics and Automation Letters, pratęsia idėją, kurią anksčiau sukūrė Ciuricho universiteto Robotikos ir suvokimo grupė.
Timas Salzmannas ir Markusas Ryllas Tech, Miuncheno technikos universiteto autonominių oro sistemų grupės tyrėjai, sakė: „Mes susidūrėme su puikiu Davide'o Scaramuzza vadovaujamos robotikos ir jutimo grupės darbu, siekdami sukurti savo pagrindinę idėją turėti duomenis. -varomi (išmokti) komponentai, kurie palaiko „tradicinius“ valdymo algoritmus. Mus iš karto sužavėjo.
„Sukūrę koncepcijos įrodymą, kaip išplėsti savo požiūrį naudojant Gauso procesus (GP) į bendruosius neuroninius tinklus (gilaus mokymosi modelius), pristatėme savo idėją Robotikos ir suvokimo grupei Ciuricho universitete. Nuo šio momento abiejų laboratorijų techninis darbas ir bandymai vyko kartu ir užmezgė naują partnerystę.
Giluminio mokymosi modeliai ir internetinis MPC optimizavimas yra sujungti naujoje sistemoje, kurią pasiūlė Salzmann, Ryll ir kt. Giluminio mokymosi išraiškos modeliams reikia daug skaičiavimų. Vis dėlto sistema gali naudoti specializuotą aparatinę įrangą (GPU), kad šiuos modelius būtų galima efektyviai pateikti internete realiuoju laiku. Tai leidžia jų sistemoms realiu laiku numatyti geriausią robotų veiksmų eigą.
Salzmannas ir Ryllas sakė: „Realiojo laiko neuronų MPC sistema leidžia abiem domenams derinti optimalų valdymą ir gilų mokymąsi, tuo pačiu leidžiant abiem dalims pasinaudoti savo labai optimizuotomis sistemomis ir skaičiavimo įrenginiais. „Taigi, valdymo optimizavimą galima atlikti naudojant C kodą, sudarytą CPU, o giluminio mokymosi skaičiavimus galima atlikti naudojant GPU naudojant PyTorch / Tensorflow. Tai leidžia gilųjį mokymąsi panaudoti tose programose, kurios iki šiol buvo nepraktiškos, pvz., optimaliam borto kvadratoriaus valdymui.
Tyrėjai vertina savo sistemą atlikdami modeliavimą ir lauko testus. Šiuose tyrimuose jis ypač naudojamas labai mobilaus kvadratoriaus judesiams valdyti realiu laiku.
Galimybė naudoti neuroninių tinklų topologijas, kurių parametrinis pajėgumas buvo 4.000 kartų didesnis nei anksčiau naudotas mobiliųjų robotų judesiams reguliuoti realiuoju laiku, leido jiems pasiekti labai daug žadančių rezultatų. Jie taip pat išsiaiškino, kad jų sukurta sistema gali sumažinti erdvinio sekimo klaidas iki 82%, palyginti su tradiciniais MPC metodais be gilaus mokymosi komponento.
Pasak Salzmanno ir Ryllo, „robotikoje mes ieškome prasmingų valdomų sistemų dinamikos ir jų sąveikos su aplinka modelių (pvz., aerodinaminiai efektai, padangų trintis ir kt.)“. „Nors juos dažnai sunku analizuoti, mokymu pagrįsti metodai, ypač naudojantys neuroninius tinklus, gali užfiksuoti dinamiką ir sąveikos efektus. Tačiau modelio tikslumas didėja didėjant neuroninio tinklo dydžiui. Kai realaus laiko neuroniniame MPC naudojami giluminio mokymosi modeliai, modelis yra daug galingesnis ir efektyvesnis nuspėjamosios kontrolės srityje, nei buvo įmanoma anksčiau.
GPU lustai pamažu patenka į įterptąsias sistemas, kaip rodo neseniai pristatyta Nvidia Jetson platforma. Ši mokslininkų komanda netrukus sukūrė sistemą, kuri leis dizaineriams panaudoti didelę sudėtingų duomenimis pagrįstų AI metodų nuspėjimo galią, kad būtų galima geriau modeliuoti robotų dinamiką ir sąveiką su aplinka, sumažinti nelaimingų atsitikimų riziką ir pagerinti navigacijos galimybes, integruoti GPU lustai.
Salzmannas ir Ryllas pažymėjo, kad yra daug neištirtų tolesnių studijų galimybių. „Gilaus mokymosi metodų rezultatas gali būti nenuspėjamas situacijose, kurios nėra įtrauktos į mokymo duomenis (Nepaskirstytas OOD). Tvirtumas OOD sąlygomis atsiranda aptikus tas sąlygas ir suteikiant atsarginę valdymo priemonę sistemai stabilizuoti.
Šaltinis: techxplore.com/news
Günceleme: 13/03/2023 14:09