Gervigreindarrannsóknarstofan OpenAI hefur tilkynnt upplýsingar um nýjustu tækni sína sem mun verulega bæta 3D flutning. OpenAI er fyrirtækið á bak við texta-í-mynd rafallið PLÖTA, sem hefur nú snúið sér að því að þýða textavísbendingar í þrívíddarpunktaský, sem það mun kalla POINT-E.
Samkvæmt skjal, gefið út af OpenAI, POINT-E "býr til þrívíddarlíkön á aðeins 3-1 mínútum á einni GPU," samanborið við aðrar núverandi lausnir sem geta tekið klukkustundir og krafist margra GPU.
Útdráttur úr skýrslunni lýsir núverandi stað POINT-E í þrívíddarlíkanaheiminum: „Þó að aðferðin okkar sé enn undir nýjustu nýjustu hvað varðar gæði sýna, þá er hún einni til tveimur stærðargráðum hraðari og býður upp á hagnýt málamiðlun fyrir sum notkunartilvik.“
Það virkar með því að búa til eina tilbúna mynd með texta-mynddreifingarlíkani. Þrívíddarpunktaský er síðan búið til sem er auðveldara að búa til, sem dregur úr álagi á GPU, þó að það fangi ekki fínar upplýsingar, sem er skipting sem nefnd er í greininni.
Önnur gervigreind hefur verið þjálfuð til að draga úr sumum þessara vandamála, en blaðið útskýrir að það geti "stundum misst af fíngerðum/rafmjóum hlutum" eins og plöntustönglum og skapað blekkingu um fljótandi blóm.
OpenAI lofar að þjálfa gervigreind á nokkrum milljónum þrívíddarlíkana og lýsigögnum þeirra, þó að umfang hennar sé frekar takmarkað enn sem komið er.
Eitt slíkt dæmi er flutningur á raunverulegum hlutum fyrir þrívíddarprentun, þó að þegar tæknin þróast og batnar sé líklegt að við munum sjá hana notaða í flóknari forritum eins og leikjum og jafnvel sjónvarpi.
Opinn uppspretta verkefni fáanlegt á GitHub.
Þú getur hjálpað Úkraínu að berjast gegn rússnesku innrásarhernum. Besta leiðin til að gera þetta er að gefa fé til hersins í Úkraínu í gegnum Bjarga lífi eða í gegnum opinberu síðuna NBU.