Video: Как разгадывать капчу автоматически при парсинге (Listopad 2024)
Téměř kdykoli se zaregistrujete pro online účet, musíte prokázat, že jste člověk, čtením a zadáváním nějakého zmateného textu, který údajně nemohl být dekódován počítačem. Proč? Předpokládejme, že by podvodník mohl pomocí skriptu okamžitě vytvořit milion účtů na Facebooku. Mohl by s těmi, než ho Facebook vypne, způsobit mnoho problémů. S milionem falešných e-mailových účtů mohl posílat spoustu spamu. Pomocí milionu falešných účtů Amazon mohl falešně poslat jakýkoli produkt na vrchol popularity nebo ho potopit do kategorie „nejhorší vůbec“. Je zřejmé, že má smysl omezit tyto účty na skutečné lidi.
Vědci na Carnegie Mellon University vytvořili termín CAPTCHA, aby popsali techniky, jak zajistit, aby online reakce pocházely od člověka, nikoli skriptů. Zkrátka to znamená „ C ompletely A utomated P ublic T uring test, který sdělí C omputers a H umans A part.“ (Dobře, udělím, že historický Turingův test vyžaduje, aby počítač reagoval, takže to nemůžete říct od člověka, ale existuje spojení).
Nejběžnější systémy CAPTCHA představují text, který je nějakým způsobem zmatený. Znaky mohou být zdeformovány, otočeny, zobrazeny na matoucím pozadí nebo mohou být jinak zmateny. Lidé je mohou stále číst, i když někdy s obtížemi. Skripty a roboti je nemohou přečíst. Nebo mohou?
Spousta problémů
Problém je v tom, že existuje mnoho způsobů, jak podvodníci obejít tento typ CAPTCHA. Optické rozpoznávání znaků se stále zlepšuje. Předběžné zpracování může odfiltrovat „hlučné“ pozadí, které se nachází ve standardních obrázcích CAPTCHA. Pokročilé algoritmy mohou řešit zkreslení. Možná automatizovaný systém scammeru dokáže vyřešit pouze jeden CAPTCHA za čtyři? Stále si může vytvořit milion falešných účtů, když se snaží čtyřikrát milionkrát.
Alternativně se podvodníci mohou spolehnout na lidskou vynalézavost. Farma CAPTCHA v chudých zemích platí lidem úskalí k řešení tisíců CAPTCHA za hodinu. Jistě, skript, který musí čekat na lidský zásah, nemůže běžet tak oslepeně rychle jako čistě kódový skript, ale to udělá práci.
Možná jste byli zařazeni jako grunt do armády řešící CAPTCHA zcela bez vašeho vědomí, zejména pokud si užíváte nezbedné obrázky. Choulostivý systém, který jsme viděli před několika lety, odhalil progresivně racier striptýzové obrazy, ale vyžadoval, aby divák vyřešil CAPTHA pro každý nový pohled bez plátna.
Nejhorší ze všeho je, že lidé ne vždy interpretují text CAPTCHA správně. Pokud web odmítne váš příspěvek, zkusíte to znovu nebo jdete jinam? A co druhé odmítnutí nebo třetí?
Alternativy Galore
Pokud se členům Fast IDentity Online (FIDO) Alliance podaří v jejich hledání, nakonec nepotřebujeme žádný druh dlážděných autentizačních systémů, jako jsou hesla nebo CAPTCHA. Jejich cílem je komplexní web ověřování se standardizovanou globální kompatibilitou. S členstvím, včetně takových těžkých hitters jako PayPall a Lenovo, je to vážná skupina. Bohužel, aliance se právě formuje; zatím pro nás nemají žádné výsledky.
"Chtěli byste hrát hru?" Počítač jednou požádal o to ve filmech, ale ve skutečném životě je těžké, aby se bota stala hravou. Autentizační modul PlayThru od Are You A Human zobrazuje velmi, velmi jednoduchou hru pokaždé odlišnou. Může například zobrazit řadu plovoucích objektů a požádat vás, abyste do panelu nástrojů vložili pouze nástroje, nebo na pizzu položili polevy. Vyhrajte hru a autentizovali jste se jako člověk. Podívejte se na ukázku zde.
Nabídka Minteye kombinuje nahrazení CAPTCHA se zabudovanou reklamou. Zobrazuje obraz, který byl zkreslen otáčením kolem středu, spolu s posuvníkem, který upravuje stupeň víření. Když kliknete na tlačítko posuvníkem na nulovém místě, kde je zkreslení odstraněno, vyřešili jste to - a nezkreslený obraz bude odhalen jako. Bohužel, ve výsledcích Google u tohoto dominují zprávy o tom, jak snadno může být hacknut.
Rozluštění a zadávání grubbyho textu ze standardní CAPTCHA může být na vaší ploše obtížným úkolem, ale na mobilním zařízení je to dvakrát tak špatné. Nejprve si přiblížíte dost zatraceně tu zatracenou věc a pak ji zadáte prstem, jak nejlépe umíte. Je to jen trapné. Společnost Confident Technologies nabízí obrazový systém CAPTCHA, který je navržen speciálně pro mobilní zařízení (ale funguje dobře na stolních počítačích). Zobrazuje mřížku obrázků spolu s řadou příkazů. Bota by mohla být schopna přečíst „Click the drink“, ale bylo by těžké rozhodnout, který obrázek představuje něco k pití.
Tito tři patří mezi nejvýznamnější, ale mnoho dalších vývojářů pracuje na vyřešení problému oddělení lidí od robotů, aniž by je otravovalo.
Podívejte se do budoucnosti
Představuji si budoucnost, ve které se každý z nás chlubí jedinečnou a neodpustitelnou elektronickou identitou, kterou akceptují všechny aplikace, webové stránky a kavárny. Možná Aliance FIDO přinese ten sen? Jsem si vědom toho, že někteří se domnívají, že by to byla invaze do soukromí, nebo dokonce znamení, že časy ukončení jsou blízko, ale pro mě se zdá velké zlepšení oproti identifikaci pomocí hesel (samozřejmě silných) a prokazování, že jsme ne roboti řešením CAPTCHA nebo ekvivalentů.