Škoda Karoq
Flokkar: IT fréttir

gervigreind fyrirtæki safna gögnum frá fjöldamiðlasíðum þvert á bein bönn

Perplexity, sem lýsir vöru sinni sem „ókeypis leitarvél með gervigreind,“ hefur sætt gagnrýni undanfarna daga. Stuttu eftir að Forbes sakaði það um að hafa stolið grein sinni og endurbirt hana á mörgum kerfum, greindi Wired frá því að Perplexity væri að hunsa Robot Exclusion Protocol, eða robots.txt, og væri að fjarlægja greinar sínar af síðunni sinni og öðrum Condé Nast útgáfum. Tæknisíðan The Shortcut sakaði einnig gervigreindarfyrirtækið um að fjarlægja greinar sínar. Nú hefur Reuters opinberað að Perplexity er ekki eina gervigreindarfyrirtækið sem framhjá robots.txt skrár og skafar vefsíður fyrir efni sem það notar síðan til að þjálfa tækni sína.

Reuters greindi frá því að það hefði séð bréf stílað til útgefenda frá TollBit, sprotafyrirtæki sem tengir þá við gervigreindarfyrirtæki svo þeir geti gert leyfissamninga og varaði þá við því að „gervigreindaraðilar frá ýmsum aðilum (ekki aðeins frá einu fyrirtæki) ákváðu að fara framhjá robots.txt samskiptareglur til að taka á móti efni frá síðum." Robots.txt skráin inniheldur leiðbeiningar fyrir leitarvélmenni hvaða síður þau geta og ekki nálgast. Vefhönnuðir hafa notað þessa samskiptareglu síðan 1994, en það er algjörlega valfrjálst að fylgja henni.

Ekkert fyrirtæki var nefnt í bréfi TollBit, en Business Insider segir að það hafi komist að því að OpenAI og Anthropic - framleiðendur spjallbotna ChatGPT og Claude, í sömu röð - séu líka að fara framhjá robots.txt merki. Bæði fyrirtækin hafa áður sagt að þau virða „ekki skríða“ leiðbeiningarnar sem vefsíður setja í robots.txt skrárnar sínar.

Við rannsókn sína komst Wired að því að vél á Amazon netþjóni „örugglega rekin af Perplexity“ var að fara framhjá robots.txt leiðbeiningum vefsíðunnar sinnar. Til að staðfesta að Perplexity sé að skrúbba innihald þess, mataði Wired verkfærafyrirsagnir fyrirtækisins úr greinum þess eða stuttum ráðum sem lýsa sögum þeirra. Sagt er að tólið hafi skilað niðurstöðum sem umorðuðu greinar hennar nákvæmlega „með lágmarks tilvísun“. Og stundum skapaði það jafnvel ónákvæmar samantektir fyrir greinar - Wired segir að spjallbotninn hafi ranglega haldið því fram að hann hafi verið að tilkynna um sérstakan lögreglumann í Kaliforníu sem hafði framið glæp í einu tilviki.

Í viðtali við Fast Company sagði Aravind Srinivas, forstjóri Perplexity, við útgáfuna að fyrirtæki hans „hundsar ekki bókun vélmennaútilokunar og lýgur síðan um það. Hins vegar þýðir þetta ekki að það njóti ekki góðs af vélmennum sem hunsa siðareglur. Srinivas útskýrði að fyrirtækið noti þriðja aðila leitarvélmenni til viðbótar við sína eigin og að vélmenni sem Wired greindi frá væri einn þeirra. Þegar Fast Company spurði hvort Perplexity hefði sagt skriðarveitunni að hætta að skríða Wired síðuna sagði hann: "Þetta er flókið."

Srinivas varði starfshætti fyrirtækis síns og sagði útgáfunni að bókun um útilokun botna "er ekki lagalegur grundvöllur" og gaf til kynna að útgefendur og fyrirtæki eins og hans gætu þurft að stofna til nýrrar tegundar sambands. Hann gaf einnig í skyn að Wired hafi vísvitandi notað vísbendingar til að láta Perplexity spjallbotninn haga sér þannig, svo venjulegir notendur myndu ekki fá sömu niðurstöður. Varðandi ónákvæmar niðurstöður sem tólið framkallaði sagði Srinivas: „Við sögðum aldrei að Perplexity spjallbotninn væri ónákvæmur: ​​„Við sögðum aldrei að við hefðum aldrei ofskynjanir.“

Lestu líka:

Deila
Julia Alexandrova

Kaffimaður. Ljósmyndari. Ég skrifa um vísindi og geim. Ég held að það sé of snemmt fyrir okkur að hitta geimverur. Ég fylgist með þróun vélfærafræði, bara ef ...

Skildu eftir skilaboð

Netfangið þitt verður ekki birt. Nauðsynlegir reitir eru merktir*