Root NationНовиниIT fréttirÍ Tókýó var sýndur árangur Alter3 mannkyns vélmennisins byggður á GPT-4

Í Tókýó var sýndur árangur Alter3 mannkyns vélmennisins byggður á GPT-4

-

Hópur við háskólann í Tókýó hefur afhjúpað Alter3, manneskjulegt vélmenni sem getur framkvæmt hreyfingar með GPT-4 Large Language Model (LLM). Alter3 notar nýjasta tólið Opna gervigreind að taka á sig mismunandi stellingar, allt frá selfie-stellingu til drauga, allt án þess að þörf sé á fyrirfram forrituðum gagnagrunnsfærslum.

„Viðbrögð Alter3 við samtalsefni með svipbrigðum og látbragði eru umtalsverð framfarir í manngerða vélfærafræði sem auðvelt er að aðlagast öðrum androidum með lágmarksbreytingum,“ sögðu rannsakendur.

Breyta 3

Á sviði LLM samþættingar við vélmenni er áherslan lögð á að bæta grunnsamskipti og móta raunhæf viðbrögð. Rannsakendur eru einnig að kafa ofan í getu LLM til að gera vélmenni kleift að skilja og framkvæma flóknar fyrirmæli og auka þannig virkni þeirra.

Hefðbundin stjórnun á lágu stigi virkar er bundið við vélbúnað og liggur utan verksviðs LLM fyrirtækja. Þetta skapar erfiðleika fyrir beina stjórnun á verkum sem byggja á LLM. Til að leysa þetta vandamál hefur japanska teymið þróað aðferð til að umbreyta tjáningu mannlegra hreyfinga í kóða sem er skiljanlegur fyrir Android. Þetta þýðir að vélmennið getur sjálfstætt búið til röð aðgerða með tímanum án þess að forritarar þurfi að forrita hvern líkamshluta fyrir sig.

Meðan á samskiptum stendur getur einstaklingur gefið Alter3 skipanir eins og „Taktu sjálfsmynd með iPhone þínum“. Í kjölfarið byrjar vélmennið röð beiðna til GPT-4 til að fá leiðbeiningar um nauðsynleg skref. GPT-4 mun þýða þetta í Python kóða sem gerir verkinu kleift að "skilja" og framkvæma nauðsynlegar hreyfingar. Þessi nýjung gerir Alter3 kleift að hreyfa efri hluta líkamans á meðan neðri líkaminn er kyrrstæður, festur við standinn.

Alter3 er þriðja endurtekningin í röð Alters af manngerðum vélmennum síðan 2016, og státar af 43 stýribúnaði sem bera ábyrgð á svipbrigðum og hreyfingum útlima knúin áfram af þrýstilofti. Þessi uppsetning býður upp á mikið úrval af svipmiklum bendingum. Vélmennið getur ekki gengið, en það getur líkt eftir dæmigerðum göngu- og hlaupahreyfingum.

Alter3 sýndi einnig hæfileikann til að afrita mannlegar stellingar með því að nota myndavélina og OpenPose rammann. Vélmennið aðlagar liðamótin að þeim stellingum sem sést og vistar vel heppnaðar eftirlíkingar til síðari nota. Samskipti við mann leiddu til fjölbreyttari líkamsstöðu, sem styður þá hugmynd að mismunandi hreyfingar komi frá því að líkja eftir manneskjunni, svipað og hvernig nýburar læra með eftirlíkingu.

Fyrir LLM þurftu vísindamenn að stjórna öllum 43 stýritækjunum vandlega til að endurskapa stellingu einstaklings eða líkja eftir hegðun, eins og að bera fram te eða tefla. Þetta krafðist fjölda handvirkra leiðréttinga, en AI hjálpaði til við að losa liðið úr þessari rútínu. „Við gerum ráð fyrir að Alter3 taki þátt í samræðum á áhrifaríkan hátt með því að sýna svipbrigði og bendingar sem skipta máli í samhengi. Það sýndi hæfileikann til að spegla tilfinningar, til dæmis að sýna sorg eða hamingju sem svar og deila þannig tilfinningum með okkur,“ segja rannsakendurnir.

Lestu líka:

Skráðu þig
Tilkynna um
gestur

0 Comments
Innbyggðar umsagnir
Skoða allar athugasemdir