Root NationНовиниIT fréttirMeta sýndi gervigreind til að búa til myndbönd byggð á lýsingunni

Meta sýndi gervigreind til að búa til myndbönd byggð á lýsingunni

-

Gervigreind (AI) texta-í-mynd rafall hefur verið að gera fyrirsagnir undanfarna mánuði, en vísindamenn hafa þegar fært sig á næsta landamæri: AI-knúnir texta-í-myndband rafall. Meta vísindamenn hafa opinberlega kynnt slíkan nýjan rafall, segir The Verge.

Vélnámsverkfræðiteymi Meta fram nýtt kerfi sem heitir Make-A-Video. Þetta gervigreind líkan gerir notendum kleift að slá inn grófa lýsingu á atriðinu og það býr til stutt myndband sem passar við texta þeirra. Myndböndin eru greinilega gervi, með óskýrum hlutum og brengluðum hreyfimyndum, en eru samt mikilvægur árangur á sviði gervigreindarefnisframleiðslu.

- Advertisement -

Í færslu sinni á Facebook Mark Zuckerberg, forstjóri Meta, lýsti verkinu sem „ótrúlegu framfari“ og bætti við: „Myndband er mun erfiðara að búa til en myndir, því auk þess að búa til hvern pixla á réttan hátt þarf kerfið líka að spá fyrir um hvernig þeir munu breytast með tímanum.

Klippurnar endast ekki lengur en í fimm sekúndur og innihalda ekkert hljóð, en ná yfir mikið úrval vísbendinga. Þó að ljóst sé að myndbandið sé tölvuframleitt munu gæði slíkra gervigreindarlíkana batna hratt í náinni framtíð. Á örfáum árum hafa gervigreindarmyndaframleiðendur farið úr því að búa til næstum óskiljanlegar myndir í ljósraunsæisefni. Og þó framfarir í myndbandi kunni að vera hægari miðað við nánast takmarkalausa flókið efnissviðið, munu verðlaunin fyrir óaðfinnanlega myndbandsgerð hvetja mörg samtök og fyrirtæki til að fjárfesta umtalsvert fjármagn í verkefnið.

Fyrirtækið segist ætla að gefa út kynningarútgáfu af kerfinu en hefur ekki gefið upp hvenær eða hvernig það verður innleitt. Í grein sem lýsir líkaninu taka Meta rannsakendur fram að Make-A-Video er þjálfað í myndatextapörum sem og ómerktum myndbandsupptökum.

Þjálfunarefnið var fengið úr tveimur gagnasöfnum, WebVid-10M og HD-VILA-100M, sem samanlagt innihalda milljónir myndbanda og spanna hundruð þúsunda klukkustunda af myndbandsupptökum. Við the vegur, þetta inniheldur myndefni.

Rannsakendur taka fram að líkanið hefur margar tæknilegar takmarkanir, auk óskýrra ramma og dreifðra hreyfimynda. Make-A-Video gefur út 16 ramma af myndbandi í upplausninni 64×64 pixlum, sem síðan er breytt stærð með sérstakri gervigreind líkani í 768×768 pixla.

Þú getur hjálpað Úkraínu að berjast gegn rússnesku innrásarhernum. Besta leiðin til að gera þetta er að gefa fé til hersins í Úkraínu í gegnum Bjarga lífi eða í gegnum opinberu síðuna NBU.

- Advertisement -

Einnig áhugavert: