Meta ka krijuar një gjenerator të ri të bazuar në inteligjencën artificiale

Gjeneruesit e inteligjencës artificiale (AI) tekst-në-imazh janë bërë tituj në muajt e fundit, por studiuesit tashmë kanë kaluar në kufirin tjetër: gjeneratorët tekst-në-video me fuqi nga AI. Studiuesit e Meta kanë prezantuar publikisht një gjenerator të tillë të ri, raporton The Verge.

Ekipi i inxhinierisë së mësimit të makinerisë së Metës prezantuar një sistem i ri i quajtur Make-A-Video. Ky model i AI lejon përdoruesit të japin një përshkrim të përafërt të skenës dhe gjeneron një video të shkurtër që përputhet me tekstin e tyre. Videot janë qartësisht artificiale, me objekte të paqarta dhe animacione të shtrembëruara, por janë ende një arritje e rëndësishme në fushën e gjenerimit të përmbajtjes së inteligjencës artificiale.

- Reklama -

Në postimin e tij në Facebook Shefi ekzekutiv i Meta, Mark Zuckerberg e përshkroi punën si një "përparim të mahnitshëm", duke shtuar: "Videoja është shumë më e vështirë për t'u krijuar sesa fotot, sepse përveç gjenerimit të saktë të çdo piksel, sistemi gjithashtu duhet të parashikojë se si do të ndryshojnë me kalimin e kohës".

Klipet zgjasin jo më shumë se pesë sekonda dhe nuk përmbajnë zë, por mbulojnë një gamë të madhe të dhënash. Ndërsa është e qartë se videoja është krijuar nga kompjuteri, cilësia e modeleve të tilla të AI do të përmirësohet me shpejtësi në të ardhmen e afërt. Në vetëm pak vite, gjeneruesit e imazheve të AI kanë kaluar nga krijimi i fotografive pothuajse të pakuptueshme në përmbajtje fotorealiste. Dhe ndërsa përparimi në video mund të jetë më i ngadalshëm duke pasur parasysh kompleksitetin pothuajse të pakufishëm të fushës së temës, çmimi për gjenerimin e pandërprerë të videove do të motivojë shumë organizata dhe kompani të investojnë burime të konsiderueshme në projekt.

Kompania thotë se planifikon të lëshojë një version demo të sistemit, por nuk ka thënë se kur dhe si do të zbatohet. Në një punim që përshkruan modelin, studiuesit e Meta-s vënë në dukje se Make-A-Video është trajnuar në çifte imazhi-titra, si dhe pamjet video të paetiketuara.

Përmbajtja e trajnimit rrjedh nga dy grupe të dhënash, WebVid-10M dhe HD-VILA-100M, të cilat së bashku përmbajnë miliona video dhe përfshijnë qindra mijëra orë pamje video. Nga rruga, kjo përfshin pamjet e aksioneve.

Studiuesit vërejnë se modeli ka shumë kufizime teknike, përveç kornizave të paqarta dhe animacioneve të shpërndara. Make-A-Video nxjerr 16 korniza video me një rezolucion prej 64×64 piksele, të cilat më pas ndryshohen përmasat duke përdorur një model të veçantë AI në 768×768 piksele.

Ju mund ta ndihmoni Ukrainën të luftojë kundër pushtuesve rusë. Mënyra më e mirë për ta bërë këtë është të dhuroni fonde për Forcat e Armatosura të Ukrainës përmes Savelife ose përmes faqes zyrtare NBU.

- Reklama -

Gjithashtu interesante:

Meta tregoi AI për krijimin e videove bazuar në përshkrimin