Root NationНовиниIT fréttirEins og í kvikmyndum: Nýja gervigreind Google myndavinnslu gerir stærðarstærð og aukningu að veruleika

Eins og í kvikmyndum: Nýja gervigreind Google myndavinnslu gerir stærðarstærð og aukningu að veruleika

-

Þú hefur sennilega séð fantasíumyndir eða sjónvarpsþætti þar sem aðalpersónan biður um að stækka myndina og bæta útkomuna - til að sýna andlit, eða númeraplötu eða önnur lykilatriði. Nýjustu gervigreindarkerfi Google (AI), byggt á svokölluðu dreifingarlíkön, eru fær um að framkvæma þetta bragð.

Það er flókið ferli að ná góðum tökum vegna þess að það er í rauninni að bæta smáatriðum við mynd sem myndavélin tók ekki upphaflega, með því að nota ofursnjallar getgátur byggðar á öðrum, svipuðum myndum.

Google

Hjá Google er þessi tækni kölluð náttúruleg myndmyndun og í þessari tilteknu atburðarás ofurhá myndupplausn. Þú byrjar á lítilli, pixlaðri mynd og endar með eitthvað skarpt, skýrt og náttúrulegt. Það er kannski ekki alveg upprunalega, en það er nógu nálægt til að líta raunverulegt út fyrir mannlegt auga.

Google hefur kynnt tvö ný gervigreind verkfæri fyrir þetta starf. Sú fyrsta er kölluð SR3, eða Super-Resolution via Repeated Refinement, og það virkar með því að bæta hávaða við mynd og fjarlægja hana síðan. Með röð líkindaútreikninga sem byggjast á stórum gagnagrunni af myndum og einhverjum vélrænum töfrum getur SR3 ímyndað sér hvernig súperháupplausn útgáfa af lágupplausnar pixlamynd lítur út.

Annað tólið er CDM, eða Cascaded Diffusion Models. Google lýsir þessu sem „leiðslum“ þar sem hægt er að beina dreifingarlíkönum – þar á meðal SR3 – fyrir hágæða mynduppbyggingu. Það tekur umbótalíkön og gerir þær að stærri myndum.

Google

Með því að nota mismunandi endurbætur í mismunandi upplausnum getur CDM nálgunin verið betri en aðrar aðferðir til að auka myndstærð, samkvæmt Google. Nýja gervigreindarvélin var prófuð á ImageNet, risastórum gagnagrunni yfir þjálfunarmyndir sem almennt eru notaðar til rannsókna á sjónrænum hlutagreiningu.

Lokaárangur SR3 og CDM er glæsilegur. Í stöðluðu prófi með 50 mannlegum sjálfboðaliðum voru myndir af mannlegum andlitum sem SR3 myndaði skakkaðar fyrir alvöru myndir í um 50% tilvika - og miðað við að tilvalið reiknirit ætti að ná 50%, það er áhrifamikið. Það er þess virði að endurtaka að þessar endurbættu myndir eru ekki nákvæmar samsvörun við frummyndirnar, þær eru vandlega útreiknaðar eftirlíkingar byggðar á stærðfræði líkinda.

Google

Google lofar miklu meiru frá nýjum gervigreindarvélum sínum og tengdri tækni – ekki aðeins hvað varðar fjölgun mynda af andlitum og öðrum náttúrulegum hlutum, heldur einnig á öðrum sviðum líkindalíkana.

Lestu líka:

Skráðu þig
Tilkynna um
gestur

0 Comments
Innbyggðar umsagnir
Skoða allar athugasemdir