Store språkmodeller skal lære kjæledyrroboter å rette feil på egen hånd

Av: Bohdan Kaminskyi | 26.03.2024, 19:56
Store språkmodeller skal lære kjæledyrroboter å rette feil på egen hånd
MIT

Forskere ved Massachusetts Institute of Technology (MIT) har utviklet en ny metode som gjør det mulig for hjemmeroboter å bruke store språkmodeller (LLM) til å korrigere feil under oppgaver uten menneskelig inngripen.

Dette er hva vi vet

Tradisjonelt har det vært vanlig at roboter går tom for programmert kapasitet når de støter på problemer, og da trenger de hjelp fra en operatør. I hjemmet kan imidlertid enhver endring i omgivelsene forstyrre robotens ytelse og tvinge den til å starte oppgaven på nytt.

Den nye teknikken, som vil bli presentert på International Conference on Learning Representations (ICLR) i mai, bruker LLM til å dele opp demonstrasjonsoppgaver i mindre deloppgaver. På denne måten kan roboten automatisk gjenkjenne hvor den befinner seg og selv planlegge videre handlinger i tilfelle feil.

-"LLM har en måte å fortelle deg hvordan du skal gjøre hvert trinn i en oppgave, på et naturlig språk. Et menneskes kontinuerlige demonstrasjon er legemliggjøringen av disse trinnene i det fysiske rommet. Vi ønsket å koble disse to sammen, slik at en robot automatisk kan vite hvor langt den er kommet i en oppgave, og være i stand til å planlegge på nytt og hente seg inn igjen på egen hånd", sier doktorgradsstudent Tsun-Hsuan Wang.

I eksperimentene ble roboten vist mens den utførte oppgaven med å overføre baller fra en beholder til en annen. Forskerne introduserte små forstyrrelser, som å kaste roboten ut av kurs eller slå baller ut av skjeen. Takket være LLM var roboten i stand til å korrigere handlingene sine og fortsette arbeidet uten å starte på nytt.

-Med vår metode trenger vi ikke å be mennesker om å programmere eller gi ekstra demonstrasjoner av hvordan man gjenoppretter etter feil når roboten gjør feil, sier Wang.

Forskerne forventer at anvendelsen av LLM i robotteknologi i hjemmet vil overvinne en av de viktigste hindringene for masseadopsjon av slike enheter.

Kilde: TechCrunch