Root NationНовиниIT fréttirMeta talgervigreind þekkir yfir 4 töluð tungumál

Meta talgervigreind þekkir yfir 4 töluð tungumál

-

Meta búið til gervigreind tungumálalíkan sem er ekki ChatGPT klón. Massively Multilingual Speech (MMS) verkefni fyrirtækisins getur þekkt meira en 4 töluð tungumál og endurskapað tal (texta í tal) á meira en 000 tungumálum. Eins og flest opinberlega tilkynnt gervigreind verkefni, gerir Meta í dag MMS opinn aðgang til að hjálpa til við að varðveita fjölbreytileika tungumálsins og hvetja vísindamenn til að þróa það. „Í dag erum við að deila líkönum okkar og kóða opinberlega svo að aðrir meðlimir rannsóknarsamfélagsins geti byggt á vinnu okkar,“ skrifaði fyrirtækið. "Þökk sé þessari vinnu vonumst við til að leggja lítið af mörkum til varðveislu hins ótrúlega tungumálafjölbreytileika heimsins."

Meta

Talgreining og texta-til-tal módel krefjast venjulega þjálfunar á þúsundir klukkustunda hljóðupptökum með tilheyrandi umritunarmerkjum. En fyrir tungumál sem ekki eru almennt töluð í iðnvæddum löndum - sem mörg hver eru í útrýmingarhættu á næstu áratugum - "þessi gögn eru einfaldlega ekki til," segir Meta.

Meta tók óhefðbundna nálgun við söfnun hljóðgagna: að hlusta á hljóðupptökur af þýddum trúartextum. „Við snerum okkur að trúarlegum textum, eins og Biblíunni, sem hafa verið þýddir á mörg mismunandi tungumál og þýðingar þeirra hafa verið mikið rannsakaðar fyrir textatengdar þýðingarrannsóknir,“ sagði fyrirtækið. "Þessar þýðingar eru með hljóðupptökum sem eru aðgengilegar almenningi af fólki sem les þessa texta á mismunandi tungumálum." Með því að setja inn ómerktar færslur úr Biblíunni og álíka texta fjölguðu Meta-rannsakendur fjölda tungumála sem eru tiltæk fyrir líkanið í yfir 4.

„Þrátt fyrir að innihald hljóðupptökunnar sé trúarlegt sýnir greining okkar að þetta hefur ekki áhrif á framleiðslu líkansins á trúarlegri tungu,“ skrifar Meta. "Við teljum að þetta sé vegna þess að við notum tengingarfræðilega tímaflokkun (CTC) nálgun, sem er miklu takmarkaðri miðað við stór tungumálalíkön (LLM) eða raðlíkön fyrir talgreiningu." Jafnframt, þrátt fyrir að meirihluti trúarlegra texta hafi verið lesinn af körlum, leiddi þetta ekki til hlutdrægni karla – kerfið þekkti jafn vel kven- og karlraddir.

Eftir að hafa þjálfað jöfnunarlíkan til að gera gögnin nothæfari, notaði Meta wav2vec 2.0, "sjálfstýrt tungumálakynningarnám" líkan fyrirtækisins sem getur lært á ómerkt gögn. Sambland af óhefðbundnum gagnaheimildum og sjálfstýrðu tallíkani leiddi til glæsilegra niðurstaðna. „Niðurstöður okkar sýna að líkön af fjöltyngdum útsendingum standa sig vel miðað við núverandi gerðir og ná yfir 10 sinnum fleiri tungumál.“ Sérstaklega bar Meta MMS saman við Whisper frá OpenAI og niðurstöðurnar fóru fram úr væntingum. „Við komumst að því að líkön sem eru þjálfuð á gögnum um mikið fjöltyngt tal hafa helmingi minna hlutfall af orðvillum, en mikið fjöltyngt tal nær yfir 11 sinnum fleiri tungumál.

Meta varar við því að nýju gerðir þess séu ekki fullkomnar. „Til dæmis er nokkur hætta á að tal-til-texta líkanið þýði rangt einstök orð eða orðasambönd,“ skrifar fyrirtækið. „Það fer eftir niðurstöðunni, þetta getur leitt til móðgandi og/eða ónákvæms orðalags. Við höldum áfram að trúa því að samstarf innan gervigreindarsamfélagsins sé mikilvægt fyrir ábyrga þróun gervigreindartækni.

Meta

Nú þegar Meta hefur gefið út MMS fyrir opinn uppspretta rannsóknir, vonast það til að snúa við þeirri þróun að fækka tungumálum í heiminum í 100 eða færri, sem flest eru studd af helstu tækni. Hún sér heim þar sem hjálpartækni, TTS og jafnvel VR / AR tækni gerir öllum kleift að tala og læra á sínu móðurmáli. Þar segir: "Við sjáum fyrir okkur heim þar sem tæknin hefur þveröfug áhrif, hvetur fólk til að halda tungumálum sínum á lífi vegna þess að það getur nálgast upplýsingar og notað tækni á meðan það talar móðurmálið sitt."

Lestu líka:

DzhereloEngadget
Skráðu þig
Tilkynna um
gestur

0 Comments
Innbyggðar umsagnir
Skoða allar athugasemdir