Captcha [1] (från CAPTCHA - engelska C ompletely A utomated Public T uring test to tell Computers and Humans A part - ett helt automatiserat offentligt Turing-test för att skilja mellan datorer och människor ) är ett datortest som används för att avgöra om användaren av systemet är en människa eller en dator.
Termen "Captcha" dök upp år 2000. Huvudtanken med testet är att erbjuda användaren en uppgift som lätt kan lösas av en person, men extremt svår och tidskrävande för en dator. Från och med 2013 läggs cirka 320 miljoner captchas in varje dag av användare över hela planeten [2] .
CAPTCHA är ett varumärke som tillhör Carnegie Mellon University , som utvecklade detta test.
I den vanligaste versionen av captcha anger användaren de tecken som visas på bilden (ofta med tillägg av brus eller genomskinlighet), men på ett sådant sätt att maskinigenkänning av texten är mycket svårt. Enligt allmänt accepterade standarder för internettillgänglighet för synskadade bör en sådan captcha kompletteras med en variant baserad på taligenkänning (audio captcha). Det finns även captchas där du behöver välja rätt bild från listan [3] .
Andra dåligt algoritmiska uppgifter kan också användas: till exempel ta reda på vad som finns på bilden, markera alla bilder med katter, eller svara på en fråga relaterad till människors kunskap eller mentalitet (till exempel gåtan: "ett päron hänger , du kan inte äta det”). Ändå är det karaktärsigenkänning som har blivit standarden: det är inte bundet till någon kultur (det största hindret är dålig syn), det fungerar även på mobila webbläsare och en erfaren användare känner snabbt igen en bild som en captcha. Kombinerade captchas är också möjliga.
Nackdelen med captcha är att det inte alltid är möjligt att analysera det. På grund av detta måste du ibland ange captcha flera gånger.
Antag att bilden med siffrorna 1234 anropas av koden:
< img src = "/captcha.php?code=1234" />Istället för att skicka captcha, läser maskinen URL:en och anger svaret 1234 .
Med otillräckliga kvalifikationer för en webbprogrammerare kan en bot ge ett svar utan att klara testet. Till exempel, enligt viss information på sidan, kan datorn själv, utan mänsklig inblandning, korrekt svara på en fråga som endast en person förmodligen skulle kunna svara på. Eller så klarar en person testet en gång, och datorn tillverkar många förfrågningar med samma svar.
Den används främst för "icke-traditionella" captchas med ett litet antal svarsalternativ (1000 eller mindre). Roboten "gissar" genom att skicka slumpmässiga svar, och några av dem visar sig vara korrekta.
Detta tillvägagångssätt är effektivt när frågorna förbereds av administratören och inte genereras av maskinen. Med hjälp av databaser kan du gå igenom många icke-traditionella captcha-alternativ: till exempel markera alla bilder med katter.
Efter cutoff bildas ett slumpmässigt mönster på bokstäverna, så det finns ingen 100% garanti för att alla tecken kommer att kännas igen (i PWNtcha är betyget för denna CAPTCH 99%). Men den återstående procenten är helt irrelevant.
Den nya phpBB-forumtråden (3.xx) har som standard en förbättrad CAPTCHA med hjälp av GD Graphics Library .
Det finns program (till exempel: PWNtcha) som känner igen specifika captcha-implementationer. Dessutom är det möjligt att koppla moduler från allmänna textigenkänningsprogram (till exempel: FineReader , OmniPage ) till tredjepartsprogram för captcha-bildigenkänning.
I relation till automatiserad igenkänning finns begreppen "svag captcha" och "stark captcha". Bland "svagheterna" finns ett fast teckensnitt, en fast position av tecken, ingen förvrängning, separering av tecken från bakgrunden med hjälp av en färgknapp eller Gaussisk oskärpa , enkel separation av tecken från varandra, etc. Men ibland händer det att en stark captcha är svårt att känna igen och för en person, vilket redan är en oacceptabel extrem. Ibland finns det en captcha som är lätt att läsa av en dator och med stor svårighet av en person (till exempel med en bild med låg kontrast), en sådan captcha motsvarar inte alls syftet med captcha som sådan.
Om den genererade bilden visade sig vara oläslig har användaren som regel möjlighet att få en ny. En stark captcha bör returnera en bild med ett annat svar [4] .
Många icke-traditionella captcha-varianter visade sig också vara svaga - "icke-robotresistenta" [5] [6] .
Det finns en "igenkänningsmetod" som använder en mänsklig resurs från mycket besökta webbplatser. Roboten laddar ner captcha från den nödvändiga internettjänsten och presenterar den för webbplatsbesökaren. I gengäld får webbplatsbesökaren tillgång till resursen och roboten känner igen koden som visas på bilden och matar in den på den "stormade" sajten. En webbplatsbesökare kanske inte ens misstänker att varje video de tittar på förvandlas till registrering av en ny brevlåda för att skicka skräppost.
För att skydda (inte helt) från denna metod att kringgå captcha, ändrar webbplatsen automatiskt captcha-bilden om svaret på den inte matades in omedelbart (inom en kort tidsperiod), regelbundet varje gång efter en viss tidsperiod, eller när du försöker starta ett försenat svar.
Det finns också specialiserade sajter för att utbyta eller sälja captchas.
Captcha ensam kan inte stoppa spammare . Å andra sidan kan denna skyddsmetod orsaka stora olägenheter för människor.
Dessutom missbrukas captcha, till exempel av filhosting , vilket ger tjänster för captcha-igenkänning till massorna och gör det ännu mer ineffektivt [7] .
reCAPTCHA är ett projekt som använder ett oläsligt ord för OCR , som är ett av många förvrängda fragment av skannade böcker, förutom ett datorgenererat ord, som ett arbetselement för användarens svar på en captcha-förfråganDenna tjänst tar hänsyn till användningsmetoderna och kapaciteten hos program för att digitalisera boktexter . För tillförlitligheten erbjuds samma ord till flera användare av olika webbplatser. När olika användare ger samma svar på en CAPTCHA-förfrågan antas de ha skrivit in rätt ord.
Ordböcker och uppslagsverk | |
---|---|
I bibliografiska kataloger |
|