Çfarë është Binjakët: Gjithçka rreth modelit të ri të AI nga Google

Google sapo ka lëshuar modelin e tij më të fuqishëm të AI të quajtur ndonjëherë Binjakët. Çfarë është ajo dhe çfarë mund të bëjë? Për gjithçka në artikullin tonë.

Google ka vite që po zhvillon mjetet e veta të AI. Me publikimin e ChatGPT-3 nga OpenAI, kompania që drejton motorin më të njohur të kërkimit në botë ka krijuar gjithashtu një mjet të ngjashëm, Bard. Por ky mjet ende humbi ndaj konkurrentëve, gjë që Google nuk mund ta lejonte. Prandaj, nuk është për t'u habitur që bota së fundmi pa Gemini, një model i ri gjuhësor nga Google, për të cilin mësuam gjatë prezantimit.

Ai është krijuar jo vetëm për të përmirësuar LLM-në e mëparshme (Large Language Model) të gjigantit, por edhe për të ofruar mundësi krejtësisht të reja në fushën e përpunimit të tekstit, grafikës dhe zërit.

Pra, le të hedhim një vështrim më të afërt në modelin e ri të gjuhës Google Gemini.

Gjithashtu interesante: OpenAI Project Q*: çfarë është dhe pse projekti është një shqetësim

PËRMBAJTJA

1. Çfarë është Google Gemini?

2. Kush e krijoi modelin?

3. Mundësitë

4. A ka versione të ndryshme?

5. Si të hyni në Binjakët?

6. Binjakët në Google Bard: Çfarë do të ndryshojë?

7. Binjakët në telefonat inteligjentë Google Pixel

8. Si është Gemini i ndryshëm nga modelet e tjera të AI, si GPT-4?

9. Shqetësimet për saktësinë dhe paanshmërinë

10. E ardhmja është me Binjakët

Çfarë është Google Gemini?

Ky është një model i ri dhe i fuqishëm i inteligjencës artificiale nga Google, i cili mund të kuptojë jo vetëm tekstin, por edhe imazhet, videot dhe audion. Ky model multimodal përshkruhet si i aftë të kryejë detyra komplekse në matematikë, fizikë dhe fusha të tjera, si dhe të kuptojë dhe gjenerojë kode me cilësi të lartë në një sërë gjuhë programimi.

Gemini është aktualisht i disponueshëm përmes integrimit me Google Bard dhe Google Pixel 8 dhe gradualisht do të përfshihet në shërbimet e tjera të Google.

"Gemini është rezultat i një përpjekjeje të madhe bashkëpunuese në të gjithë ekipet e Google, duke përfshirë kolegët tanë në Google Research," - tha Dennis Hassabis, CEO dhe bashkëthemelues i Google DeepMind. "Ai u ndërtua nga themeli për të qenë multimodal, që do të thotë se mund të përgjithësojë dhe kuptojë pa probleme, të operojë dhe të kombinojë lloje të ndryshme informacioni, duke përfshirë tekstin, kodin, audion, imazhet dhe videon."

- Reklama -

Gjithashtu interesante: Jo gjithçka që ne e quajmë AI është në të vërtetë inteligjencë artificiale. Ja çfarë duhet të dini

Kush e krijoi modelin?

Siç ndoshta e keni marrë me mend tashmë, Gemini u krijua nga Google dhe Alphabet, kompania mëmë e Google, dhe është modeli më i avancuar i kompanisë deri më sot. Divizioni DeepMind i Google dha gjithashtu një kontribut të rëndësishëm në zhvillimin e tij. Nuk dihet ende se sa punonjës kanë marrë pjesë në zhvillim dhe çfarë fondesh janë ndarë për këtë, por duke ditur aftësitë e Google, mund të jemi të sigurt se ka një shumë shumë të madhe.

Gjithashtu interesante: Windows 12: Cili do të jetë OS i ri

Mundësitë

Siç e theksova më lart, është një model multimodal, që do të thotë se mund të kuptojë, operojë dhe kombinojë lloje të ndryshme të dhënash, duke përfshirë tekstin, kodin, audion, imazhet dhe videon. Ai siguron aftësi më të mira të të kuptuarit, të menduarit dhe kodimit në krahasim me sistemet e mëparshme të AI.

Aftësitë kryesore të modelit janë:

Përpunimi i gjuhës natyrore për detyra të tilla si përkthimi, përmbledhja dhe dialogu
Të menduarit matematikor dhe zgjidhja e problemeve
Aftësia për të gjeneruar kod dhe dokumentacion
Kuptimi i imazheve, audio dhe video
Multitasking në fusha të ndryshme

Siç mund ta shihni, aftësitë janë më të larta se modelet e tjera.

Në testet e të kuptuarit të gjuhës, të menduarit matematikor dhe kodimit, Gemini Ultra ia kalonte modeleve të tilla si GPT-4. Në veçanti, është modeli i parë që tejkalon performancën e nivelit njerëzor në testin Massive Multitask Language Understanding (MMLU), duke arritur mbi 90% saktësi.

Në 32 teste akademike të një studimi të madh të modelit gjuhësor, Binjakët ia kaloi GPT-4. Në 30 raste, modeli i ri i gjuhës nga Google ishte më i mirë se konkurrenti. Kjo tregon aftësinë e modelit për të kuptuar plotësisht gjuhën.

Lexoni gjithashtu: Projekti i trurit të njeriut: Një përpjekje për të imituar trurin e njeriut

A ka versione të ndryshme?

Google e përshkruan këtë AI si një model fleksibël që mund të funksionojë në çdo pajisje: nga qendrat e të dhënave të Google deri te pajisjet celulare. Për të arritur këtë shkallëzim, Gemini vjen në tre versione: Nano, Pro dhe Ultra.

Le të flasim për versionet e ndryshme të Binjakëve në më shumë detaje.

Binjakët Nano: projektuar për të punuar në telefonat inteligjentë, veçanërisht Google Pixel 8. Është krijuar për të kryer detyra që kërkojnë përpunim efikas nga inteligjenca artificiale pa u lidhur me serverë të jashtëm, si p.sh. sugjerimi i përgjigjeve në programet e bisedës ose përmbledhja e tekstit. Ky model kompakt pajisjesh ka rreth 6 miliardë parametra.
Binjakët Pro: funksionon në qendrat e të dhënave të Google. Pro është krijuar për të punuar me versionin më të fundit të chatbot-it Bard AI. Është në gjendje të ofrojë kohë të shpejta përgjigjeje dhe të kuptojë pyetje komplekse. Një model i mesëm ka afërsisht 100 miliardë parametra dhe është thelbi i AI bisedore të Bard. Pro do të jetë i disponueshëm përmes Google Cloud.
Binjakët Ultra: megjithëse versioni Ultra nuk është ende gjerësisht i disponueshëm, Google e përshkruan atë si modelin e tij me performancën më të mirë, duke tejkaluar "gjendjen aktuale të teknologjisë për 30 nga 32 testet akademike të përdorura gjerësisht të përdorura në kërkimin e modelit të gjuhës së madhe (LLM). " Si versioni më i madh dhe më i fuqishëm, Ultra do të marrë më shumë se 1 trilion parametra. Ai do të vendoset në qendrat e të dhënave. Ultra është përshtatur për përdorim të korporatës. Versioni është krijuar për të kryer detyra shumë komplekse. Google planifikon ta lëshojë atë pas përfundimit të fazës aktuale të testimit. Kjo do të thotë, versioni më i fuqishëm nuk është ende i disponueshëm për përdoruesit.

Gjithashtu interesante: Google Bard AI: Gjithçka që duhet të dini

- Reklama -

Si të hyni në Binjakët?

AI në versionet Nano dhe Pro tani janë të disponueshme në produktet e Google si telefonat inteligjentë Google Pixel 8 dhe chatbot Bard, përkatësisht. Google planifikon ta integrojë përfundimisht në motorin e tij të kërkimit, reklamat, shërbimin e postës elektronike Gmail, shfletuesin Chrome dhe shërbime të tjera.

Zhvilluesit dhe klientët e ndërmarrjeve do të jenë në gjendje të hyjnë në Pro përmes Gemini API në Google AI Studio dhe Google Cloud Vertex AI duke filluar nga 13 dhjetori 2023. Zhvilluesit Android do të ketë akses në modelin e versionit Nano nëpërmjet AICore, i cili do të jetë i disponueshëm në një vrojtim të hershëm.

Lexoni gjithashtu: Samsung Galaxy Flip5 vs Motorola Razr 40 Ultra: Beteja e dy Yokozunëve

Binjakët në Google Bard: Çfarë do të ndryshojë?

Sipas informacionit të dhënë gjatë prezantimit, modeli do të lejojë Google Bard të trajtojë më mirë problemet më komplekse, siç thuhet:

“Ne e projektuam Gemini në mënyrë që modeli të jetë natyrshëm multi-modal dhe i para-trajnuar në modalitete të shumta që nga fillimi. Më pas e rafinuam duke shtuar më shumë të dhëna multimodale për të përmirësuar performancën. Si rezultat, Binjakët e kupton lehtësisht dhe nxjerr përfundime shumë më mirë se modelet e mëparshme multimodale dhe krenohet me aftësitë më të fundit në pothuajse të gjitha fushat.

Aftësitë e jashtëzakonshme multimodale të Binjakëve ju ndihmojnë të kuptoni informacione komplekse tekstuale dhe vizuale. Ato janë veçanërisht të dobishme kur bëhet fjalë për nxjerrjen e informacionit specifik nga grupe të mëdha të dhënash. Aftësia e jashtëzakonshme e këtij modeli për të nxjerrë thelbin e informacionit nga qindra mijëra dokumente duke i lexuar, filtruar dhe analizuar ato padyshim që do të kontribuojë në zbulime të reja, të shpejta rrufe në fusha të ndryshme, nga shkenca në financa."

Gjatë prezantimit, u demonstrua një shembull i një studimi kompleks, i cili përmban më shumë se 200 mijë regjistrime, disa prej të cilave duhej të përditësoheshin sipas të dhënave të reja. Siç mund ta keni marrë me mend, bërja e kësaj me dorë do të kërkonte shumë kohë, kështu që autorët e studimit përdorën Gemini për të përgatitur kodin që merrte të dhëna dhe bënte përditësimet e nevojshme. Një shembull tjetër më real është përdorimi i modelit gjuhësor të Google për të shpjeguar problemet e matematikës ose fizikës.

Të dhënat e dhëna këtu ishin një foto/skanim i një detyre nga një mësim shkollor. Sistemi ishte në gjendje të përpunonte grafikën dhe tekstin e ruajtur atje dhe më pas të tregonte se cilat pjesë të detyrave të shtëpisë ishin bërë saktë dhe cilat kërkonin më shumë vëmendje. Prezantimi tregoi se një përdorues mund të kërkojë në mënyrë të përsëritur Binjakët të shpjegojnë një detyrë, dhe çdo përpjekje pasuese duhet të shpjegohet në një gjuhë më të thjeshtë. Se sa të sakta dhe korrekte do të jenë Binjakët, sigurisht që do të kontrollohet nga të interesuarit, por aftësia për të lexuar dhe përpunuar tekstin direkt nga fotot është mbresëlënëse. Siç u shtua gjatë prezantimit:

"Binjakët janë mësuar të njohin dhe kuptojnë tekstin, imazhet, tingujt dhe më shumë në të njëjtën kohë. Falë kësaj, ai kupton më mirë nuancat e informacionit dhe mund t'u përgjigjet pyetjeve komplekse. Është veçanërisht efektiv në shpjegimin e temave që lidhen me matematikën dhe fizikën, kështu që mund të shërbejë si një ndihmës personal për detyrat e shtëpisë".

Binjakët në telefonat inteligjentë Google Pixel

Google gjithashtu u mburr se Gemini "ka mësuar" në çipat e rinj TPUv5 dhe planifikon të prezantojë Gemini Ultra në fillim të vitit 2024, i cili do të përdorë Bard Advanced, një version i ri i versionit të konsumatorit të modelit të të folurit të gjigantit. Gemini Ultra është aktualisht në testim dhe tashmë është në dispozicion për ekspertë të përzgjedhur të sigurisë.

Informacioni i fundit i rëndësishëm është prezantimi i Gemini në telefonat inteligjentë Google Pixel 8. Kjo do të mundësojë, ndër të tjera, krijimin e përgjigjeve të shpejta përmes aplikacionit Gboard në mesazhe. E para është WhatsApp, por vitin e ardhshëm zgjidhje të tilla do të shfaqen në aplikacione të tjera që lidhen me komunikimin. Megjithatë, ky është vetëm fillimi, pasi Google ka njoftuar shumë mjete të reja të AI për telefonat inteligjentë Pixel 8, dhe ato do të jenë të disponueshme në disa pajisje të tjera në të ardhmen. Android. Megjithatë, këto janë plane të mëtejshme dhe për momentin nuk janë dhënë detaje.

Si është Gemini i ndryshëm nga modelet e tjera të AI, si GPT-4?

Modeli i ri Gemini i Google duket të jetë një nga modelet më të mëdha dhe më të avancuara të AI deri më sot, megjithëse lëshimi i modelit Ultra do ta përcaktojë me siguri këtë. Krahasuar me modelet e tjera të njohura që aktualisht përdorin chatbot të AI, Gemini dallohet me veçorinë e tij multimodale, ndërsa modelet e tjera si GPT-4 mbështeten në shtojcat dhe integrimin për të qenë vërtet multimodal.

Shqetësimet për saktësinë dhe paanshmërinë

Edhe pse Binjakët është një hap i madh përpara në zhvillimin e aftësive të inteligjencës artificiale, ai ka të njëjtat mangësi si modelet e tjera kryesore gjuhësore. Para së gjithash, kjo është mundësia e krijimit të informacionit të rremë. Paragjykimet bazohen gjithashtu në të dhënat e trajnimit të disponueshme për modelin e ri gjuhësor. Vlen gjithashtu të përmendet kuptimi i kufizuar i botës reale. Google pranon se modeli i ri i Binjakëve mund të bëjë gabime, të sigurojë fakte që nuk bazohen në prova dhe kundërshtojnë sensin e përbashkët.

Nevojiten më shumë teste, veçanërisht për Gemini Ultra, i cili ka aftësi të reja që ende nuk janë eksploruar plotësisht. Google është e përkushtuar të vlerësojë me kujdes Binjakët për të minimizuar dëmet e mundshme.

Gjithashtu interesante: Gjithçka rreth Microsoft Kopiloti: e ardhmja apo rruga e gabuar?

E ardhmja është me Binjakët

Lansimi i Gemini nga Google çoi në një epokë të re të zhvillimit të AI. Me performancën e tij më të mirë në krahasim me modelet e mëparshme dhe linjat bazë njerëzore, Gemini tregon për mundësitë e ardhshme të inteligjencës artificiale, por ende ka nevojë për më shumë kërkime për të adresuar disa mangësi.

Në të ardhmen, mund të prisni që Gemini të ofrojë veçori më të dobishme dhe inteligjente në produktet e Google. Në vazhdim, kompania planifikon të vazhdojë të zgjerojë Gemini përtej anglishtes dhe të ndërtojë metodologjinë e modelit të saj bazë.

Ne vetëm mund të shikojmë dhe shpresojmë që Google e di se çfarë po bën.

Lexoni gjithashtu:

Më shumë nga autori

Regjistrohu

0 Comments

Shqyrtime të ngulitura

Shiko të gjitha komentet

Artikuj të tjerë

Çfarë është Gemini: Gjithçka rreth modelit të ri të AI të Google