Root Nationlajmlajme ITFigura AI tregoi aftësitë e reja të robotit të saj humanoid të AI

Figura AI tregoi aftësitë e reja të robotit të saj humanoid të AI

-

Zhvillimi i robotëve humanoidë ka ecur me një ritëm të ngadaltë për pjesën më të madhe të dy dekadave, por kohët e fundit ne kemi parë gjithnjë e më shumë përparime në këtë fushë. Siç kemi shkruar së fundmi, një robot me AI u prezantua në MWC 2024 Amerikëndhe një zhvillim tjetër, Unitree H1, theu rekordin e shpejtësisë mes robotëve humanoidë. Dhe tani një rezultat spektakolar i bashkëpunimit midis kompanive Figure AI dhe OpenAI është shfaqur në internet - një video mahnitëse e një roboti humanoid që tani mund të zhvillojë biseda me njerëz.

Figura AI dhe OpenAI prezantuan një robot të ri humanoid me AI

Startup Figure AI publikoi një video që tregon robotin Figure 01 duke punuar me modelin e ri të gjuhës vizuale (VLM). Në të, Figura 01 qëndron në një tryezë në të cilën ka një pjatë, një mollë dhe një filxhan. Ka një tharëse në të majtë. Dhe pyetjes së një personi se çfarë sheh roboti përballë, ai i përgjigjet duke përshkruar me detaje gjithçka që shtrihet në tavolinë.

Dhe pastaj burri e pyet nëse mund të hajë diçka, dhe roboti përgjigjet: "Sigurisht", dhe më pas me një lëvizje të shkathët të qetë merr mollën dhe ia jep burrit. Pas kësaj vjen një tjetër demonstrim mahnitës - një burrë derdh mbeturina të thërrmuara nga një shportë përpara Figurës 01 dhe i kërkon robotit të shpjegojë pse e bëri këtë, dhe në të njëjtën kohë të mbledhë mbeturinat në shportë. Dhe ai shpjegon "mendimin" e tij ndërsa e vendos letrën përsëri në koshin e plehrave. "Kështu që ju dhashë një mollë sepse është i vetmi artikull ushqimor që mund t'ju jap nga tavolina," tha roboti.

Përfaqësuesit e kompanisë shpjeguan se Figura 01 përdor një model multimodal të para-trajnuar OpenAI, VLM, për të kuptuar imazhet dhe tekstet, dhe mbështetet në kërkesat zanore për të gjeneruar përgjigjet e saj. Kjo është e ndryshme nga, të themi, GPT-4 e OpenAI, e cila fokusohet në kërkesat e shkruara.

Ai gjithashtu përdor atë që kompania e quan "manipulime bimanuale të mësuara të nivelit të ulët". Sistemi koordinon kalibrimin e saktë të imazhit (deri në nivelin e pikselit) me rrjetin e tij nervor për kontrollin e lëvizjes. "Këto rrjete marrin imazhe në 10 Hz dhe gjenerojnë veprime 24-DOF (pozicionet e kyçit të dorës dhe këndet e kyçeve të gishtave) në 200 Hz," tha Figura AI në një deklaratë.

Kompania pretendon se çdo sjellje në video bazohet në mësimin e sistemit, kështu që askush në prapaskenë nuk po tërheq fijet e Figurës 01. Sigurisht, ka një nuancë - nuk dihet se sa herë roboti e kaloi këtë procedurë. Ndoshta ishte hera e njëqindtë, gjë që shpjegon lëvizjet e tij të sakta. Por në çdo rast, kjo arritje duket spektakolare dhe paksa fantastike.

Lexoni gjithashtu:

Burimiteknik
Regjistrohu
Njoftoni për
mysafir

0 Comments
Shqyrtime të ngulitura
Shiko të gjitha komentet