Phi-3-mini është një zbulim i madh Microsoft në fushën e inteligjencës artificiale?

Modeli i inteligjencës artificiale Phi nga Microsoft - i vogël, i lirë dhe nuk vuan nga "halucinacione". Kështu thonë ata për modelin e ri gjuhësor, i cili parashikohet të ketë një të ardhme të madhe.

GPT është absolutisht i shkëlqyeshëm, por në të njëjtën kohë, është jashtëzakonisht i shtrenjtë dhe nuk mund të jetë i përsosur për të gjithë. Për këto dhe shumë arsye të tjera Microsoft po eksperimenton me modele shumë më të vogla të AI. Thuhet se Phi-3-mini madje e turpëron punën e inxhinierëve të OpenAI.

Gjithashtu interesante: Transistorët e së ardhmes: Na pret një epokë e re çipash

PËRMBAJTJA

1. ChatGPT nuk është një ilaç

2. Ajo që dihet për Microsoft phi

3. Si të përdorni Phi-3-mini?

4. Microsoft A do të zëvendësojë Phi modelet e tipit ChatGPT?

5. Phi-3 nga Microsoft kupton vetëm anglisht

ChatGPT nuk është një ilaç

ChatGPT është një shpikje që financohet, kurohet dhe përmirësohet Microsoft. Në fakt, nuk i takon Microsoft, dhe kompania OpenAI, e cila Microsoft nuk zotëron (ajo është investitori kryesor, megjithëse jo më i madhi). Modeli i gjuhës GPT dha Microsoft një avantazh gjigant ndaj pjesës tjetër të korporatave të mëdha të teknologjisë që tani po nxitojnë të arrijnë. Sidoqoftë, ka një numër të madh problemesh me GPT, shumë prej të cilave nuk mund të zgjidhen ende.

Para së gjithash, ky është një model gjuhësor që kërkon shumë burime. I orientuar në ueb Microsoft Copilot i OpenAI ose ChatGPT gjenerojnë kosto shumë të larta operacionale për Microsoft. Kjo është një veçori jo vetëm e GPT, por edhe e të gjitha modeleve kryesore gjuhësore. Për më tepër, GPT, si konkurrentët e tij, është i prirur ndaj "halucinacioneve", domethënë mund të gjenerojë përgjigje ndaj pyetjeve që përmbajnë informacion të rremë ose mashtrues. Sa më shumë të dhëna të thithë një model i tillë, aq më shumë tenton të gjenerojë përmbajtje të ngjashme. Prandaj, halucinacionet dhe deklaratat e rreme nuk janë një mit i thithur nga gishti dixhital. Përdoruesit shpesh vërejnë se modelet e mëdha gjuhësore shpesh bëjnë gabime, japin të dhëna të pasakta dhe veprojnë mbi fakte që nuk ekzistojnë.

Të dy problemet janë shumë serioze, prandaj OpenAI, Microsoft, Meta, Google dhe të tjerë po punojnë për të zhvilluar jo vetëm teknologjinë Large Language Model, por edhe Small Language Model, i cili në praktikë mund të prodhojë rezultate shumë më të mira.

Asistenti i një llogaritari dixhital nuk ka nevojë të dijë shumë për fizikën kuantike. Mund të jetë shumë më i vogël dhe më pak kompleks (dhe për këtë arsye më i lirë), dhe duke u trajnuar vetëm mbi të dhënat e nevojshme për qëllimin e tij, teorikisht duhet të halucinojë më pak. Megjithëse, kjo është më e lehtë të thuhet sesa të bëhet. Teknologjia GenAI është ende një sipërmarrje e egër IT. Dhe megjithëse puna po përparon me një ritëm të paprecedentë, është ende e vështirë që praktikisht të bëhen përparime në çështjet themelore. Por kompania Microsoft njoftoi së fundmi një zbulim të tillë. Po flasim për një model të vogël gjuhësor Microsoft Phi.

Gjithashtu interesante: Si Tajvani, Kina dhe SHBA po luftojnë për dominimin teknologjik: lufta e madhe e çipave

Ajo që dihet për Microsoft phi

Para së gjithash, duhet të theksohet se eksperimenti u krye pa pjesëmarrjen e kompanisë OpenAI. Domethënë është zhvillimi i inxhinierëve Microsoft.

- Reklama -

Modelet Microsoft Phi është një seri modelesh të vogla gjuhësore (SLM) që arrijnë rezultate të jashtëzakonshme në një sërë testesh. Modeli i parë, Phi-1, kishte 1,3 miliardë parametra dhe arriti rezultatet më të mira të kodimit Python midis SLM-ve ekzistuese.

Zhvilluesit më pas u fokusuan në të kuptuarit dhe të menduarit e gjuhës, duke krijuar modelin Phi-1.5, i cili gjithashtu kishte 1,3 miliardë parametra dhe tregoi performancë të krahasueshme me modelet me pesë herë më shumë parametra.

Phi-2 është një model 2,7 miliardë parametrash që demonstron aftësi të jashtëzakonshme të arsyetimit dhe të të kuptuarit të gjuhës, duke performuar në nivelin e modeleve më të mira bazë me 13 miliardë parametra. Phi-2 dallohet nga modelet e tjera për shkak të inovacioneve të tij në shkallëzimin e modeleve dhe trajnimin e kurimit të të dhënave.

Është i disponueshëm në katalogun e modeleve Azure AI Studio, i cili lehtëson kërkimin dhe zhvillimin në fushën e modeleve gjuhësore. Phi-2 u lançua në dhjetor 2023. Zhvilluesit sigurojnë se funksionon po aq mirë sa Mistral ose llama 2 nga Meta. Dhe Phi-3 funksionon edhe më mirë se versioni i mëparshëm.

Megjithatë, modeli Phi-3 që sapo u prezantua është krejtësisht i ri në cilësi. Të paktën kështu mund të gjykoni nga informacioni i dhënë Microsoft. Sipas kompanisë, sipas treguesve të të gjitha standardeve të njohura, Phi-3 performon më mirë se çdo model tjetër me përmasa të ngjashme, duke përfshirë analizën e gjuhës, punën e programimit ose punën matematikore.

Phi-3-mini, versioni më i vogël i këtij modeli, sapo është vënë në dispozicion të të gjithë të interesuarve. Kjo është, ajo ka qenë e disponueshme që nga 23 Prilli. Phi-3-mini ka 3,8 miliardë parametra dhe, sipas matjeve Microsoft, dy herë më efikas se çdo model tjetër me të njëjtën madhësi. Mund të gjendet në katalogun e modeleve të AI të shërbimit cloud Microsoft Azure, platforma e modelit të mësimit të makinerive Hugging Face dhe Ollama, një kornizë për ekzekutimin e modeleve në një kompjuter lokal.

Siç pretendon ai Microsoft, Phi-3-mini nuk kërkon çipa të fuqishëm Nvidia. Modeli mund të funksionojë në çipa të zakonshëm kompjuterik. Ose përshtateni edhe në një telefon që nuk është i lidhur me internetin.

Më pak fuqi do të thotë gjithashtu se modelet nuk do të jenë aq të sakta. Phi-3 nuk do të jetë i përshtatshëm për mjekë apo kontabilistë tatimorë, por do të ndihmojë në detyra më të thjeshta. Për shembull, për shënjestrimin e reklamave ose përmbledhjen e komenteve në internet.

Meqenëse modelet më të vogla kërkojnë më pak përpunim, ato do të jenë më të lira për përdorim nga kompanitë private. Kjo është, në Microsoft do të ketë më shumë klientë që do të dëshironin të përfshinin AI në punën e tyre, por e konsideruan atë shumë të shtrenjtë. Megjithatë, ende nuk është e qartë se sa do të kushtojnë.

Nuk dihet ende se kur do të shfaqen modelet e vogla dhe të mesme. Por kjo e fundit do të jetë më e fuqishme dhe më e shtrenjtë. Edhe pse tashmë dihet se Phi-3-small do të ketë 7 miliardë parametra, dhe Phi-3-medium do të ketë deri në 14 miliardë parametra.

- Reklama -

Lexoni gjithashtu:

Si të përdorni Phi-3-mini?

GPT-4 Turbo kërkon çipa të fuqishëm AI, të cilët janë ende shumë të shtrenjtë. Modeli i vogël i të folurit Phi-3 mund të funksionojë jashtë linje, pa cloud, edhe me një çip në një telefon celular.

Phi-3 nuk është një produkt për përdoruesit fundorë, por një teknologji që zhvilluesit do të jenë në gjendje ta përdorin dhe zbatojnë në aplikacionet e tyre - si të bazuara në cloud, domethënë të vendosura në distancë, ashtu edhe ato që punojnë në nivel lokal dhe jashtë linje. Pritet të funksionojë pa probleme me pajisjet dhe komponentët e tyre, si telefonat celularë, makinat dhe sistemet e tyre të info-argëtimit, apo edhe sensorët IoT. Në disa skenarë, kjo teknologji mund të jetë e paçmueshme.

Microsoft madje jep një shembull konkret që të mos na duhet të sforcojmë imagjinatën tonë. Imagjinoni një fermer duke inspektuar të korrat e tij dhe duke parë shenja sëmundjesh në gjethe, kërcell dhe degë. Duke qenë larg shtyllave të telekomunikacionit, ai do të duhet vetëm të nxjerrë telefonin e tij, të bëjë një foto të dëmtimit, ta vendosë në një aplikacion që përdor teknologjinë Phi-3 - dhe modeli do të analizojë shpejt dhe jashtë linje foton dhe do të japë këshilla për si ta luftojmë saktësisht këtë sëmundje.

Siç shpjegon ai Microsoft, çelësi i suksesit të GPT ishte të përdorte sasi masive të dhënash për trajnim. Me grupe kaq të mëdha të dhënash, cilësia e lartë e të dhënave nuk mund të diskutohet. Ndërkohë, gjatë trajnimit të modelit Phi, është përdorur qasja e kundërt OpenAI. Në vend që ta mbushnin modelin me informacion, fokusi ishte në të mësuarit në rritje dhe të plotë.

Në vend të përdorimit të të dhënave të papërpunuara të internetit, studiuesit Microsoft krijoi grupin e të dhënave TinyStories, duke gjeneruar miliona histori në miniaturë "bebe". Këto histori u përdorën për të trajnuar modele gjuhësore shumë të vogla. Studiuesit më pas shkuan më tej duke krijuar grupin e të dhënave CodeTextbook, i cili përdori të dhëna të përzgjedhura me kujdes, të disponueshme publikisht, të cilat u filtruan për vlerën arsimore dhe cilësinë e përmbajtjes. Këto të dhëna më pas u filtruan disa herë dhe u kthyen në një model të madh gjuhësor (LLM) për sintezë të mëtejshme.

E gjithë kjo bëri të mundur krijimin e një grupi të dhënash të mjaftueshme për të trajnuar një SLM më të aftë. Për më tepër, në zhvillimin e modelit Phi-3 u përdor një qasje me shumë nivele për menaxhimin dhe zbutjen e rrezikut, duke përfshirë vlerësimin, testimin dhe rregullimet manuale. Si rezultat, siç pretendon ai Microsoft, zhvilluesit që përdorin familjen e modeleve Phi-3 mund të përfitojnë nga grupi i mjeteve të disponueshme në Azure AI për të ndërtuar aplikacione më të sigurta dhe të besueshme.

Lexoni gjithashtu: Teleportimi nga pikëpamja shkencore dhe e ardhmja e tij

Microsoft A do të zëvendësojë Phi modelet e tipit ChatGPT?

Aspak. Modelet e vogla të gjuhëve (SLM), edhe kur trajnohen për të dhëna me cilësi të lartë, kanë kufizimet e tyre dhe nuk janë të dizajnuara për mësim të thellë. Modelet e mëdha të gjuhës (LLM) i tejkalojnë SLM-të në arsyetimin kompleks për shkak të madhësisë dhe fuqisë së tyre llogaritëse. LLM-të janë dhe do të vazhdojnë të jenë veçanërisht të dobishme në fusha të tilla si zbulimi i drogës, ku duhet kërkuar nëpër koleksione të gjera punimesh shkencore dhe analizuar modele komplekse. Nga ana tjetër, SLM mund të përdoret për detyra më të thjeshta, të tilla si përmbledhja e pikave kryesore të një dokumenti të gjatë teksti, krijimi i përmbajtjes ose fuqizimi i chatbot-eve të shërbimit ndaj klientit.

Microsoft, tha ajo, tashmë përdor grupe modelesh hibride në brendësi, ku LLM merr drejtimin, duke drejtuar pyetje të caktuara që kërkojnë më pak fuqi kompjuterike te SLM, ndërsa ajo trajton vetë pyetje të tjera, më komplekse. Phi është pozicionuar për llogaritje në pajisje, pa përdorur cloud. Megjithatë, do të ketë ende një hendek midis modeleve të vogla gjuhësore dhe nivelit të inteligjencës që mund të merret me modelet e mëdha në re. Ky hendek, falë zhvillimit të vazhdueshëm të LLM, nuk ka gjasa të zhduket së shpejti.

Phi-3 ende nuk është verifikuar nga palët e jashtme të pavarura. Microsoft ndonjëherë flet për efikasitet 25 herë më të lartë ose efikasitet energjetik në raste ekstreme, krahasuar me konkurrentët, gjë që tingëllon mjaft përrallore. Edhe pse nga ana tjetër nuk mund të harrohet se këto vite kanë kaluar Microsoft na largoi pak nga fakti se është një lider i qartë në inovacionet e IT, dhe ndoshta kjo është arsyeja pse ne nuk e besojmë vërtet. Programe të bazuara në AI që përgjigjen menjëherë dhe funksionojnë jashtë linje në vend që të gjenerojnë? Ky do të ishte një kulm i denjë i revolucionit aktual. Fatkeqësisht, ekziston një problem kryesor.

Lexoni gjithashtu: Gjithçka rreth çipit Neuralink Telepathy: çfarë është dhe si funksionon

Phi-3 nga Microsoft kupton vetëm anglisht

Phi-3 nuk gëlltiti petabajtet e hedhura në të në masë. Trajnimi i kujdesshëm dhe skrupuloz i modelit përfshin një problem të vogël. Phi-3 është trajnuar me informacione në anglisht dhe nuk ka asnjë ide për ndonjë gjuhë tjetër ende. Jo vetëm ukrainase, por edhe gjermane, spanjolle, franceze apo kineze. Sigurisht, kjo e zvogëlon shumë tërheqjen e saj për shumicën e përdoruesve në mbarë botën.

Por në Microsoft siguroi se po punohet për zhvillimin dhe përmirësimin e tij. Edhe pse nuk duhet ta mashtroni veten me faktin se tregu ukrainas është një prioritet për asnjë nga korporatat e mëdha. Prandaj, do të duhet të presim një kohë shumë të gjatë për mbështetjen e gjuhës ukrainase. Por ky fakt nuk i ka ndalur asnjëherë entuziastët dhe ata që duan të vazhdojnë me progresin.

Lexoni gjithashtu:

Më shumë nga autori

Regjistrohu

0 Comments

Shqyrtime të ngulitura

Shiko të gjitha komentet

Artikuj të tjerë