"Paradigmeskifte" innen robotteknologi: Alter3-roboten kombinert med GPT-4: Nå kan den ta selfies og spille på en imaginær gitar, og den programmeres med stemmen i stedet for komplekse kommandoer.

Av: Anry Sergeev | 19.12.2023, 19:58

Et forskerteam fra University of Tokyo klarte å bygge en kobling mellom den store språkmodellen GPT-4 og Alter3-roboten, noe som gjorde det mulig å utføre mer menneskelignende bevegelser og programmere roboten på naturlig språk, og dermed gå bort fra tradisjonelle maskinvareavhengige kontrollsystemer. Prosjektforfatterne kaller dette fremskrittet et "paradigmeskifte" innen robotteknologi.

Alter3 er den nyeste versjonen av den humanoide roboten, som først ble tatt i bruk i 2016. Den er i stand til å utføre komplekse overkroppsbevegelser, inkludert detaljerte ansiktsuttrykk, og har 43 akser som etterligner bevegelsene i menneskets muskel- og skjelettsystem. Den hviler på en sokkel, men kan ikke gå (selv om den kan simulere gange). Ved hjelp av GPT-4 lærte forskerne roboten å utføre ulike simuleringer, som å ta en selfie, kaste en ball, spise popcorn og spille på en imaginær gitar. Tidligere krevde disse aktivitetene at man kodet spesifikke instruksjoner for hver handling, men med GPT-4 kan robotene lære seg vanlige taleinstruksjoner.


-Spill "Smoke on the Water" for oss.

Forskerne sier at "direkte kontroll er nå mulig ved å overføre de språklige uttrykkene for menneskelige handlinger til robotkroppen gjennom programvarekode. Dette gir større muligheter for samarbeid mellom mennesker og roboter. Med dette gjennombruddet innen robotteknologi kan vi forvente mer intelligente, tilpasningsdyktige og personlige robotenheter. Alter3-roboten har et innebygd kamera som gjør at den kan "se" mennesker og forbedre atferden sin ved å observere reaksjonene deres.

Ved hjelp av språkmodeller i robotforskningen kan forskere forenkle prosessen med å koordinere de mange leddene i en robot ved å gi verbale instruksjoner, beskrive bevegelsesalternativer og få tak i programvarekoden som starter robotens motor. På denne måten slipper forskerne å programmere hver enkelt bevegelse for 43 akser, og kan omkonfigurere og forbedre robotens bevegelser raskere, smidigere og mer nøyaktig over tid.


Alter3 viser frem zombier

Forskerne har også lagt til litt humor i Alter3s aktiviteter. I et scenario demonstrerer roboten at den spiser en pose popcorn, men så viser det seg at popcornet tilhører en person som sitter ved siden av den. Robotens ansiktsuttrykk og håndbevegelser formidler overraskelse og skam.

Kilde: techxplore.com