Root NationНовиниIT fréttirGervigreindarmyndavél var kennt að búa til tónlist

Gervigreindarmyndavél var kennt að búa til tónlist

-

Tónlist framleidd með gervigreind (AI) er þegar orðin að veruleika. Gervigreindarverkfæri geta nú búið til tónlist með engu nema textakvaðningu og niðurstöðurnar fara fram úr öllum væntingum.

Hins vegar þýðir þetta ekki að gervigreind verkfæri geti beint búið til tónlist. Í staðinn fer tónlistin í gegnum gervigreindarmyndavélar sem búa til litróf af tónlistinni. Þú getur síðan umbreytt þessum litrófsritum í hljóðinnskot. Þýðir þetta að gervigreind-mynduð tónlist muni koma í stað manngerðrar tónlistar í framtíðinni?

rifusion

Myndbundið gervigreind kennir tölvualgrím til að þekkja myndir af stöðum og hlutum. Eftir það eru reiknirit notaðir til að endurskapa svipaðar en einstakar myndir. DALL-E og Stable Diffusion eru góð dæmi. Í bili geturðu látið þessi forrit birta allt sem þú vilt. Allt í gegnum texta!

Svo, AI tólið sem getur búið til litróf er kallað Riffusion. Þetta er nýjasta gervigreindarverkefnið og í meginatriðum er það myndavél úr texta sem byggir á stöðugri dreifingu (Stable Diffusion). En hvernig varð hann fær um að búa til tónlist?

rifusion

Á bak við Riffusion eru vélfærafræðingurinn Heik Martiros og hugbúnaðarframleiðandinn Seth Forsgren. Þeir vildu prófa hvort nútíma gervigreind forrit gætu virkað á hljóðsviðinu. Þannig hófst tónlistarferð Riffusion. Forsgren talar um tæknina á þessa leið: „Ég og Hake spilum saman í lítilli hljómsveit og við byrjuðum á verkefninu bara vegna þess að við elskum tónlist. Eftir að hafa séð töfrandi niðurstöður Stable Diffusion fyrir myndsköpun, spurðum við okkur hvernig það myndi líta út að nota dreifingaraðferð til að búa til tónlist?

Til að komast að því þjálfaði hópur tveggja opinn uppspretta Stable Diffusion á litrófsmyndum. Þau voru sameinuð textanum. Eftir það gat forritið búið til litróf af tónlist út frá ákveðnum vísbendingum.

Í fyrstu vissu þeir ekki hvort Stable Diffusion líkanið gæti búið til litrófsmynd með nægri nákvæmni til að breyta í hljóð, en það kom í ljós að það gæti gert það og fleira. Martiros og Forsgren birtu niðurstöður sínar á opinberu Riffusion vefsíðunni. Í fyrstu var þetta áhugamál verkefni. En nú geta gestir bætt við eigin textaábendingum. Þetta mun neyða Riffusion til að búa til litróf. Síðar geta gestir notað það sem hljóðinnskot og spilað það á síðunni.

Niðurstöðurnar á þessu stigi eru kannski ekki mjög hágæða. En það er örugglega ekki eins slæmt og þú gætir haldið.

Riffusion gæti einnig reynt að spila lög sem innihalda rapp að hætti Eminem og K-Pop. En virknin við að búa til texta er ekki svo góð. Í stað texta muntu heyra hljómmikið mannlegt kjaftæði. En það athyglisverðasta er að þetta kjaftæði passar samt við tóninn í laginu.

Þessi tækni er ekki enn tilbúin til að leysa manngerða tónlist af hólmi. En verkefnið sýndi okkur að AI myndvinnslu reiknirit hafa enn mikla möguleika. Brátt getur það orðið aðstoðarmaður tónlistarhöfunda. Kannski til að fá innblástur til að semja lag.

Þú getur hjálpað Úkraínu að berjast gegn rússnesku innrásarhernum. Besta leiðin til að gera þetta er að gefa fé til hersins í Úkraínu í gegnum Bjarga lífi eða í gegnum opinberu síðuna NBU.

Dzherelogizchina
Skráðu þig
Tilkynna um
gestur

0 Comments
Innbyggðar umsagnir
Skoða allar athugasemdir