Kategorite lajme IT

Kompanitë e AI mbledhin të dhëna nga faqet e mediave masive në kundërshtim me ndalimet e drejtpërdrejta

Perplexity, e cila e përshkruan produktin e saj si një "motor kërkimi falas me inteligjencë artificiale", është kritikuar ditët e fundit. Menjëherë pasi Forbes e akuzoi atë për vjedhjen e artikullit të saj dhe ribotimin e tij në platforma të shumta, Wired raportoi se Perplexity po injoronte Protokollin e Përjashtimit të Robotit, ose robots.txt, dhe po hiqte artikujt e tij nga faqja e tij dhe botimet e tjera të Condé Nast. Faqja e teknologjisë The Shortcut akuzoi gjithashtu kompaninë e AI për heqjen e artikujve të saj. Tani Reuters ka zbuluar se Perplexity nuk është e vetmja kompani e AI që anashkalon skedarët robots.txt dhe fshin faqet e internetit për përmbajtjen që më pas përdor për të trajnuar teknologjinë e saj.

Reuters raportoi se kishte parë një letër drejtuar botuesve nga TollBit, një startup që i lidh ata me firmat e inteligjencës artificiale në mënyrë që të mund të lidhnin marrëveshje licencimi, duke i paralajmëruar ata se “agjentët e AI nga burime të ndryshme (jo vetëm nga një kompani) vendosën të anashkalojnë protokolli robots.txt për të marrë përmbajtje nga sajtet." Skedari robots.txt përmban udhëzime për robotët e kërkimit në cilat faqe mund dhe nuk mund t'i qasen. Zhvilluesit e uebit e kanë përdorur këtë protokoll që nga viti 1994, por respektimi i tij është plotësisht vullnetar.

Asnjë kompani nuk u emërua në letrën e TollBit, por Business Insider thotë se ka mësuar se OpenAI dhe Anthropic -- prodhuesit e chatbot-eve ChatGPT dhe Claude, respektivisht -- po anashkalojnë gjithashtu sinjalet robots.txt. Të dyja kompanitë kanë thënë më parë se respektojnë udhëzimet "mos zvarrit" që faqet e internetit vendosin në skedarët e tyre robots.txt.

Gjatë hetimit të tij, Wired zbuloi se një makinë në një server Amazon "të operuar patjetër nga Perplexity" po anashkalonte udhëzimet robots.txt të faqes së saj të internetit. Për të konfirmuar që Perplexity po fshin përmbajtjen e tij, Wired ushqeu titujt e mjeteve të kompanisë nga artikujt e tij, ose këshilla të shkurtra që përshkruajnë historitë e tyre. Mjeti thuhet se prodhoi rezultate që parafrazuan me saktësi artikujt e saj "me atribut minimal". Dhe nganjëherë krijonte edhe përmbledhje të pasakta për artikujt – Wired thotë se chatbot pretendonte në mënyrë të rreme se raportonte për një oficer policie të Kalifornisë që kishte kryer një krim në një rast.

Në një intervistë me Fast Company, CEO i Perplexity, Aravind Srinivas i tha botimit se kompania e tij "nuk e injoron Protokollin e Përjashtimit të Robotit dhe më pas gënjen për të". Megjithatë, kjo nuk do të thotë se nuk përfiton nga robotët që injorojnë protokollin. Srinivas shpjegoi se kompania përdor robotët e kërkimit të palëve të treta përveç të tyret, dhe se roboti i identifikuar nga Wired ishte një prej tyre. Kur Fast Company pyeti nëse Perplexity i kishte thënë ofruesit të zvarritësit që të ndalonte zvarritjen e sajtit Wired, ai tha: "Është e ndërlikuar".

Srinivas mbrojti praktikat e kompanisë së tij, duke i thënë botimit se protokolli i përjashtimit të robotëve "nuk është një bazë ligjore" dhe duke sugjeruar që botuesit dhe kompanitë si ai mund të duhet të krijojnë një lloj të ri marrëdhëniesh. Ai la të kuptohet gjithashtu se Wired ka përdorur qëllimisht sugjerime për të bërë chatbotin Perplexity të sillet në atë mënyrë, kështu që përdoruesit e rregullt nuk do të merrnin të njëjtat rezultate. Lidhur me gjetjet e pasakta të krijuara nga mjeti, Srinivas tha: "Ne kurrë nuk thamë se chatboti Perplexity ishte i pasaktë: "Ne kurrë nuk thamë se nuk kemi pasur kurrë halucinacione."

Lexoni gjithashtu:

Shpërndaje
Julia Alexandrova

Kafexhi. Fotograf. Unë shkruaj për shkencën dhe hapësirën. Mendoj se është shumë herët që ne të takojmë alienët. Unë ndjek zhvillimin e robotikës, për çdo rast ...

Lini një Përgjigju

Adresa juaj e emailit nuk do të publikohet. Fusha e kërkuar janë shënuar*