Root NationGreinarTækniHvað er Gemini: Allt um nýja gervigreindargerð Google

Hvað er Gemini: Allt um nýja gervigreindargerð Google

-

Google hefur nýlega gefið út öflugasta gervigreind líkanið sitt sem nokkru sinni hefur verið kallað Gemini. Hvað er hún og hvað getur hún gert? Um allt í greininni okkar.

Google hefur verið að þróa sín eigin gervigreindarverkfæri í mörg ár. Með opinberri útgáfu ChatGPT-3 frá OpenAI hefur fyrirtækið sem rekur vinsælustu leitarvél heims einnig búið til svipað tól, Bard. En þetta tól tapaði samt fyrir samkeppnisaðilum, sem Google gat ekki leyft. Þess vegna kemur það ekki á óvart að heimurinn hafi nýlega séð Gemini, nýtt tungumálalíkan frá Google, sem við lærðum um á kynningunni.

Það er hannað ekki aðeins til að bæta fyrri LLM (Large Language Model) risans, heldur einnig til að bjóða upp á alveg nýja möguleika á sviði textavinnslu, grafík og hljóðs.

Svo skulum skoða nánar nýja Google Gemini tungumálalíkanið.

Einnig áhugavert: OpenAI Project Q*: hvað það er og hvers vegna verkefnið er áhyggjuefni

Hvað er Google Gemini?

Þetta er nýtt og öflugt líkan af gervigreind frá Google, sem getur ekki aðeins skilið texta, heldur líka myndir, myndbönd og hljóð. Þessu fjölmótalíkani er lýst þannig að það geti framkvæmt flókin verkefni í stærðfræði, eðlisfræði og öðrum sviðum, auk þess að skilja og búa til hágæða kóða á ýmsum forritunarmálum.

Google Gemini

Gemini er nú fáanlegt með samþættingu við Google Bard og Google Pixel 8 og verður smám saman innifalinn í annarri þjónustu Google.

„Gemini er árangur af gríðarlegu samstarfi milli Google teyma, þar á meðal samstarfsfólks okkar hjá Google Research,“ — sagði Dennis Hassabis, forstjóri og annar stofnandi Google DeepMind. "Það var byggt frá grunni til að vera fjölþætt, sem þýðir að það getur alhæft og óaðfinnanlega skilið, starfað á og sameinað mismunandi tegundir upplýsinga, þar á meðal texta, kóða, hljóð, myndir og myndband."

- Advertisement -

Einnig áhugavert: Ekki er allt sem við köllum gervigreind í raun gervigreind. Hér er það sem þú þarft að vita

Hver bjó til fyrirmyndina?

Google Gemini

Eins og þú hefur sennilega þegar giskað á, var Gemini búið til af Google og Alphabet, móðurfyrirtæki Google, og er fullkomnasta gervigreind líkan fyrirtækisins til þessa. DeepMind deild Google lagði einnig mikið af mörkum til þróunar þess. Ekki er enn vitað hversu margir starfsmenn tóku þátt í þróuninni og hvaða fjármunum var úthlutað til þess, en með því að vita hvaða getu Google hefur, getum við verið viss um að það er mjög há upphæð.

Einnig áhugavert: Windows 12: Hvað verður nýja stýrikerfið

Tækifæri

Eins og ég tók fram hér að ofan er það fjölþætt líkan, sem þýðir að það getur skilið, starfað á og sameinað mismunandi tegundir gagna, þar á meðal texta, kóða, hljóð, myndir og myndband. Það veitir betri skilning, hugsun og kóðunarfærni samanborið við fyrri gervigreind kerfi.

Google Gemini

Helstu eiginleikar líkansins eru:

  • Náttúruleg málvinnsla fyrir verkefni eins og þýðingar, samantekt og samræður
  • Stærðfræðileg hugsun og lausn vandamála
  • Geta til að búa til kóða og skjöl
  • Að skilja myndir, hljóð og myndband
  • Fjölverkavinnsla á mismunandi sviðum

Eins og þú sérð eru hæfileikarnir betri en aðrar gerðir.

Í prófum á málskilningi, stærðfræðihugsun og kóðun stóð Gemini Ultra fram úr módelum eins og GPT-4. Sérstaklega er það fyrsta líkanið til að standa sig betur en frammistöðu á mönnum í Massive Multitask Language Understanding (MMLU) prófinu, sem nær yfir 90% nákvæmni.

Í 32 akademískum prófum í stórri tungumálamódelrannsókn stóð Gemini sig betur en GPT-4. Í 30 tilfellum var nýja tungumálalíkanið frá Google betri en keppinauturinn. Þetta sýnir getu líkansins til að skilja tungumálið að fullu.

Lestu líka: Human Brain Project: Tilraun til að líkja eftir mannsheilanum

Eru til mismunandi útgáfur?

Google lýsir þessari gervigreind sem sveigjanlegu líkani sem getur virkað á hvaða tæki sem er: allt frá gagnaverum Google til farsíma. Til að ná þessum sveigjanleika kemur Gemini í þremur útgáfum: Nano, Pro og Ultra.

Google Gemini

Við skulum tala nánar um mismunandi útgáfur af Gemini.

  • Gemini Nano: hannað til að virka á snjallsímum, sérstaklega Google Pixel 8. Hann er hannaður til að framkvæma verkefni sem krefjast skilvirkrar vinnslu með gervigreind án þess að tengjast utanaðkomandi netþjónum, svo sem að stinga upp á svörum í spjallforritum eða draga saman texta. Þetta fyrirferðarmikla tæki hefur um 6 milljarða breytur.
  • GeminiPro: keyrir í gagnaverum Google. Pro er hannað til að vinna með nýjustu útgáfunni af Bard AI spjallbotni. Það er fær um að veita skjótan viðbragðstíma og skilja flóknar fyrirspurnir. Meðalstórt líkan hefur um það bil 100 milljarða færibreytur og er kjarninn í samræðu AI. Pro verður fáanlegur í gegnum Google Cloud.
  • Gemini Ultra: þó að Ultra útgáfan sé ekki enn fáanleg, lýsir Google henni sem best afkastamiklu líkani sínu, sem fer yfir „núverandi nýjustu fyrir 30 af 32 víðtækum fræðilegum prófum sem notuð eru í rannsóknum á stórum tungumálalíkönum (LLM). " Sem stærsta og öflugasta útgáfan mun Ultra fá meira en 1 trilljón breytur. Það verður staðsett í gagnaverum. Ultra er aðlagað fyrir fyrirtæki. Útgáfan er hönnuð til að framkvæma mjög flókin verkefni. Google ætlar að gefa það út eftir lok núverandi prófunarfasa. Það er, öflugasta útgáfan er ekki enn í boði fyrir notendur.

Einnig áhugavert: Google Bard AI: Allt sem þú þarft að vita

- Advertisement -

Hvernig á að fá aðgang að Gemini?

AI í Nano og Pro útgáfum eru nú fáanlegar í Google vörum eins og Google Pixel 8 snjallsímunum og Bard spjallbotnum, í sömu röð. Google ætlar að lokum að samþætta það í leitarvél sína, auglýsingar, Gmail tölvupóstþjónustu, Chrome vafra og aðra þjónustu.

Hönnuðir og fyrirtækjaviðskiptavinir munu geta fengið aðgang að Pro í gegnum Gemini API í Google AI Studio og Google Cloud Vertex AI frá og með 13. desember 2023. Hönnuðir Android mun hafa aðgang að Nano útgáfu líkaninu í gegnum AICore, sem verður fáanlegt í snemma forskoðun.

Lestu líka: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: Battle of the Two Yokozuns

Gemini hjá Google Bard: Hvað mun breytast?

Samkvæmt upplýsingum sem veittar voru á kynningunni mun líkanið gera Google Bard kleift að takast betur á við flóknari vandamál, eins og segir:

„Við hönnuðum Gemini þannig að líkanið er náttúrulega fjölþætt og forþjálfað á mörgum aðferðum frá upphafi. Við betrumbætum það síðan með því að bæta við fleiri fjölþættum gögnum til að bæta árangur. Fyrir vikið skilur Gemini auðveldlega og ályktar miklu betur en fyrri fjölþættar gerðir og státar af nýjustu getu á næstum öllum sviðum.

Óvenjulegir fjölþættir eiginleikar Gemini hjálpa þér að skilja flóknar texta- og sjónrænar upplýsingar. Þau eru sérstaklega gagnleg þegar kemur að því að draga tilteknar upplýsingar úr risastórum gagnasöfnum. Óvenjulegur hæfileiki þessa líkans til að draga kjarna upplýsinga úr hundruðum þúsunda skjala með því að lesa, sía og greina þau mun án efa stuðla að nýjum, leifturhröðum uppgötvunum á ýmsum sviðum, allt frá vísindum til fjármála."

Á kynningunni kom fram dæmi um flókna rannsókn sem inniheldur meira en 200 þúsund færslur sem þurfti að uppfæra sum þeirra samkvæmt nýjum gögnum. Eins og þú gætir hafa giskað á, að gera þetta handvirkt væri mjög tímafrekt, svo höfundar rannsóknarinnar notuðu Gemini til að útbúa kóða sem tók inntakið og gerði nauðsynlegar uppfærslur. Annað, raunverulegra dæmi er að nota tungumálalíkan Google til að útskýra stærðfræði- eða eðlisfræðivandamál.

Google Gemini

Inntaksgögnin hér voru mynd/skönnun af verkefni úr kennslustund í skólanum. Kerfið gat unnið úr grafík og texta sem þar var geymdur og síðan gefið til kynna hvaða hlutar heimanámsins voru gerðir rétt og hverjir þurftu meiri athygli. Kynningin sýndi að notandi getur ítrekað beðið Gemini að útskýra verkefni og hverja síðari tilraun verður að útskýra á einfaldara tungumáli. Hversu nákvæmur og réttur Gemini verður mun að sjálfsögðu kannað af áhugasömum, en hæfileikinn til að lesa og vinna texta beint úr myndum er tilkomumikill. Eins og bætt var við í kynningunni:

"Gemini hefur verið kennt að þekkja og skilja texta, myndir, hljóð og fleira á sama tíma. Þökk sé þessu skilur hann betur blæbrigði upplýsinga og getur svarað flóknum spurningum. Það er sérstaklega áhrifaríkt við að útskýra efni sem tengjast stærðfræði og eðlisfræði, svo það getur þjónað sem persónulegur heimanámshjálp".

Gemini í Google Pixel snjallsímum

Google hrósaði sér líka af því að Gemini „lærði“ á nýju TPUv5 kubbasettunum og ætlar að kynna Gemini Ultra snemma árs 2024, sem mun nota Bard Advanced, nýja útgáfu af neytendaútgáfu af tallíkani risans. Gemini Ultra er nú í prófun og er nú þegar í boði fyrir valda öryggissérfræðinga.

Google Gemini

Síðasta mikilvæga upplýsingaefnið er kynning á Gemini í Google Pixel 8 snjallsímunum. Þetta gerir meðal annars kleift að búa til skjót svör í gegnum Gboard forritið í boðberum. Sú fyrsta er WhatsApp en á næsta ári munu slíkar lausnir birtast í öðrum forritum sem tengjast samskiptum. Hins vegar er þetta aðeins byrjunin þar sem Google hefur tilkynnt um mörg ný gervigreind verkfæri fyrir Pixel 8 snjallsímana og þau verða fáanleg á nokkrum öðrum tækjum í framtíðinni. Android. Hins vegar eru þetta frekari áætlanir og engar upplýsingar hafa verið veittar að svo stöddu.

Hvernig er Gemini frábrugðið öðrum gervigreindum gerðum, eins og GPT-4?

Nýja Gemini líkanið frá Google lítur út fyrir að vera ein stærsta og fullkomnasta gervigreind gerðin til þessa, þó að útgáfa Ultra líkansins muni ákveða það fyrir víst. Í samanburði við aðrar vinsælar gerðir sem nú nota gervigreind spjallbotna, sker Gemini sig úr með sínum eigin fjölþætta eiginleika, á meðan aðrar gerðir eins og GPT-4 treysta á viðbætur og samþættingu til að vera sannarlega fjölþætt.

Áhyggjur af nákvæmni og óhlutdrægni

Þrátt fyrir að Gemini sé stórt stökk fram á við í þróun gervigreindargetu, hefur það sömu galla og önnur helstu tungumálalíkön. Í fyrsta lagi er þetta möguleikinn á að búa til rangar upplýsingar. Hlutdrægni byggjast einnig á þjálfunargögnum sem eru tiltæk fyrir nýja tungumálalíkanið. Einnig er rétt að minnast á takmarkaðan skilning á raunheiminum. Google viðurkennir að nýja Gemini líkanið geti gert mistök, komið með staðreyndir sem eru ekki byggðar á sönnunargögnum og stangast á við heilbrigða skynsemi.

Google Gemini

Fleiri prófana er þörf, sérstaklega fyrir Gemini Ultra, sem hefur nýja möguleika sem hefur ekki enn verið kannaður að fullu. Google hefur skuldbundið sig til að meta Gemini vandlega til að lágmarka hugsanlegan skaða.

Einnig áhugavert: Allt um Microsoft Aðstoðarflugmaður: framtíðin eða á rangan hátt?

Framtíðin er með Gemini

Kynning á Gemini frá Google hóf nýtt tímabil gervigreindarþróunar. Með bestu frammistöðu sína miðað við fyrri gerðir og mannlegar grunnlínur, bendir Gemini á framtíðarmöguleika gervigreindar, en þarf samt frekari rannsóknir til að taka á ákveðnum annmörkum.

Í framtíðinni geturðu búist við því að Gemini bjóði upp á gagnlegri og snjöllari eiginleika í Google vörum. Framvegis ætlar fyrirtækið að halda áfram að stækka Gemini út fyrir ensku og byggja á kjarnaaðferðafræði líkansins.

Við getum aðeins horft á og vonað að Google viti hvað það er að gera.

Lestu líka: 

Yuri Svitlyk
Yuri Svitlyk
Sonur Karpatafjallanna, óviðurkenndur stærðfræðisnillingur, "lögfræðingur"Microsoft, hagnýtur altruisisti, vinstri-hægri
- Advertisement -
Skráðu þig
Tilkynna um
gestur

0 Comments
Innbyggðar umsagnir
Skoða allar athugasemdir