Root Nationlajmlajme ITFjalimi i Metës AI njeh mbi 4 gjuhë të folura

Fjalimi i Metës AI njeh mbi 4 gjuhë të folura

-

Meta krijoi një model të gjuhës së AI që nuk është një klon ChatGPT. Projekti Massively Multilingual Speech (MMS) i kompanisë mund të njohë më shumë se 4 gjuhë të folura dhe të riprodhojë të folur (tekst në të folur) në më shumë se 000 gjuhë. Ashtu si shumica e projekteve të saj të shpallura publikisht të AI, Meta sot e bën MMS akses të hapur për të ndihmuar në ruajtjen e diversitetit gjuhësor dhe për të inkurajuar studiuesit që ta zhvillojnë atë. "Sot ne po ndajmë publikisht modelet dhe kodin tonë në mënyrë që anëtarët e tjerë të komunitetit të kërkimit të mund të ndërtojnë punën tonë," shkroi kompania. “Falë kësaj pune, ne shpresojmë të japim një kontribut të vogël në ruajtjen e diversitetit të jashtëzakonshëm gjuhësor të botës”.

Meta

Njohja e të folurit dhe modelet e tekstit në të folur zakonisht kërkojnë trajnim për mijëra orë regjistrime audio me etiketat shoqëruese të transkriptimit. Por për gjuhët që nuk fliten gjerësisht në vendet e industrializuara – shumë prej të cilave kërcënohen me zhdukje në dekadat e ardhshme – “kjo e dhënë thjesht nuk ekziston”, thotë Meta.

Meta mori një qasje jokonvencionale për mbledhjen e të dhënave audio: dëgjimin e regjistrimeve audio të teksteve fetare të përkthyera. "Ne iu drejtuam teksteve fetare, si Bibla, të cilat janë përkthyer në shumë gjuhë të ndryshme dhe përkthimet e të cilave janë studiuar gjerësisht për kërkime të përkthimit të bazuar në tekst," tha kompania. "Këto përkthime kanë në dispozicion publikisht regjistrime audio të njerëzve që lexojnë këto tekste në gjuhë të ndryshme." Duke përfshirë hyrje të pashënuara nga Bibla dhe tekste të ngjashme, studiuesit e Meta e rritën numrin e gjuhëve të disponueshme për modelin në mbi 4.

“Edhe pse përmbajtja e regjistrimeve audio është fetare, analizat tona tregojnë se kjo nuk ndikon në prodhimin e një gjuhe më fetare nga modelja”, shkruan Meta. "Ne besojmë se kjo është për shkak se ne përdorim një qasje të klasifikimit kohor të lidhjes (CTC), e cila është shumë më e kufizuar në krahasim me modelet e mëdha të gjuhës (LLM) ose modelet e sekuencës për njohjen e të folurit." Gjithashtu, përkundër faktit se shumica e teksteve fetare lexoheshin nga meshkujt, kjo nuk çoi në një paragjykim mashkullor – sistemi i njihte njësoj mirë zërat femërorë dhe meshkuj.

Pas trajnimit të një modeli shtrirjeje për t'i bërë të dhënat më të përdorshme, Meta përdori wav2vec 2.0, modelin "të mësuarit e vetë-mbikëqyrjes së përfaqësimit të gjuhës" të kompanisë që mund të mësojë në të dhëna të paetiketuara. Kombinimi i burimeve jo-tradicionale të të dhënave dhe një modeli të të folurit të vetëdrejtuar çoi në rezultate mbresëlënëse. "Rezultatet tona tregojnë se modelet e transmetimit masiv shumëgjuhësh performojnë mirë në krahasim me modelet ekzistuese dhe mbulojnë 10 herë më shumë gjuhë." Në veçanti, Meta krahasoi MMS me Whisper të OpenAI, dhe rezultatet i tejkaluan pritjet. "Ne zbuluam se modelet e trajnuara mbi të dhënat Massively Multilingual Speech kanë gjysmën e përqindjes së gabimeve në fjalë, por Massively Multilingual Speech mbulon 11 herë më shumë gjuhë."

Meta paralajmëron se modelet e reja të saj nuk janë perfekte. "Për shembull, ekziston një rrezik që modeli i fjalës në tekst mund të përkthejë gabimisht fjalë ose fraza individuale," shkruan kompania. “Në varësi të rezultatit, kjo mund të çojë në gjuhë ofenduese dhe/ose të pasakta. Ne vazhdojmë të besojmë se bashkëpunimi brenda komunitetit të AI është kritik për zhvillimin e përgjegjshëm të teknologjive të AI.”

Meta

Tani që Meta ka lëshuar MMS për kërkime me burim të hapur, ajo shpreson të ndryshojë trendin e reduktimit të numrit të gjuhëve në botë në 100 ose më pak, shumica e të cilave mbështeten nga teknologjitë kryesore. Ajo sheh një botë ku teknologjia ndihmëse, TTS dhe madje edhe teknologjitë VR / AR i lejojnë të gjithë të flasin dhe të mësojnë në gjuhën e tyre amtare. Ai thotë: "Ne parashikojmë një botë ku teknologjia ka efektin e kundërt, duke i inkurajuar njerëzit të mbajnë gjuhët e tyre gjallë, sepse ata mund të kenë akses në informacion dhe të përdorin teknologjinë ndërsa flasin gjuhën e tyre amtare."

Lexoni gjithashtu:

BurimiEngadget
Regjistrohu
Njoftoni për
mysafir

0 Comments
Shqyrtime të ngulitura
Shiko të gjitha komentet