Google e bën realitet zmadhimin dhe përmirësimin e fotografive

Ju ndoshta keni parë filma fantazi ose shfaqje televizive ku personazhi kryesor kërkon të zmadhojë imazhin dhe të përmirësojë rezultatin - të tregojë një fytyrë, një targë ose ndonjë detaj tjetër kyç. Sistemet më të fundit të inteligjencës artificiale (AI) të Google, të bazuara në të ashtuquajturat modelet e difuzionit, janë në gjendje të kryejnë këtë truk.

Është një proces i ndërlikuar për t'u zotëruar sepse në thelb shton detaje në një imazh që kamera nuk e kapi fillimisht, duke përdorur supozime super të zgjuara bazuar në imazhe të tjera të ngjashme.

Google

Në Google, kjo teknikë quhet sintezë natyrale e imazhit, dhe në këtë skenar të veçantë, rezolucion ultra i lartë i imazhit. Ju filloni me një foto të vogël, me piksel dhe përfundoni me diçka të mprehtë, të qartë dhe të natyrshme. Mund të mos jetë saktësisht origjinali, por është mjaft afër për t'u dukur reale për syrin e njeriut.

Google ka prezantuar dy mjete të reja të AI për këtë punë. E para quhet SR3, ose Super-Rezolucioni nëpërmjet Përsosjes së Përsëritur, dhe funksionon duke shtuar zhurmë në një imazh dhe më pas duke e hequr atë. Nëpërmjet një sërë llogaritjesh probabiliste të bazuara në një bazë të dhënash të madhe imazhesh dhe disa magji të mësimit të makinerive, SR3 mund të imagjinojë se si duket një version me rezolucion super të lartë i një imazhi me piksel me rezolucion të ulët.

Mjeti i dytë është CDM, ose Modelet e Difuzionit të Kaskaduar. Google i përshkruan këto si "tubacione" përgjatë të cilave modelet e difuzionit - duke përfshirë SR3 - mund të drejtohen për përmirësimin e imazhit me cilësi të lartë. Ai merr modele përmirësimi dhe i bën ato në imazhe më të mëdha.

Google

Duke përdorur modele të ndryshme përmirësimi me rezolucione të ndryshme, qasja CDM është në gjendje të tejkalojë metodat alternative të përmirësimit të imazhit, sipas Google. Motori i ri i AI u testua në ImageNet, një bazë të dhënash gjigante e imazheve stërvitore që përdoret zakonisht për kërkime në njohjen vizuale të objekteve.

Rezultatet përfundimtare të SR3 dhe CDM janë mbresëlënëse. Në një test standard me 50 vullnetarë njerëzorë, imazhet e fytyrave njerëzore të krijuara nga SR3 u ngatërruan me foto reale rreth 50% të rasteve – dhe duke marrë parasysh që një algoritëm ideal duhet të arrijë 50%, kjo është mbresëlënëse. Vlen të përsëritet se këto imazhe të zgjeruara nuk janë ndeshje të sakta të origjinaleve, ato janë simulime të llogaritura me kujdes bazuar në matematikën e probabilitetit.

Google

Google premton shumë më tepër nga motorët e tij të rinj të AI dhe teknologjitë e lidhura me to – jo vetëm në drejtim të shtimit të imazheve të fytyrave dhe objekteve të tjera natyrore, por edhe në fusha të tjera të modelimit probabilistik.

Lexoni gjithashtu:

Burimishkencor

Regjistrohu

0 Comments

Shqyrtime të ngulitura

Shiko të gjitha komentet

Artikuj të tjerë

Ashtu si në filma: Inteligjenca artificiale e re e Google për përpunimin e fotografive e bën realitet shkallëzimin dhe përmirësimin e tyre

Komentet e fundit