REcaptcha erreicht neuen Bücherrekord
Wer kennt es nicht- das ewige Captcha entziffere . Was hat es für einen Sinn, sinnlose Anneinanderreihungen von Buchstaben und Zahlen zu entziffern, die noch dazu auf so schönem Hintergrund liegen, dass selbst das Menschliche Auge Probleme hat, es zu entschlüsseln? –> SINNLOS!
Das hat sich auch Luis von Ahn gefragt – Erfinder von reCaptcha und sofort agiert.
Wer reCaptcha noch nicht kennt – es handelt sich dabei um ein Projekt, dass Bücher für die Open Content Alliance scannt. Hin und wieder kommt es vor, dass die dort eingesetzte OCR Software (Die Software, die das gescannte in Text verwandelt) manche Wörter nicht erkennt. Man kann also entweder alles manuell eintragen oder “darauf verzichten”-ist das Werk eben nicht vollständig indexiert.
Ooooooder man benutzt reCaptcha und lässt die normalen Internet User mithelfen und schützt dabei den Admin vor Spam! Setzt der Admin reCaptcha ein, wird dem User eben ein nicht von der OCR Software decodierter Wortgebilde zurück gegeben, das er doch bitte eingeben soll. Meist ist das eine Kombination von 2 Wörtern. Wenn es richtig gelöst wurde, geht das wieder durch die OCR Software und schon habt ihr dazu Beigetragen, dass ein Werk “besser” inexiert wurde – danke reCaptcha!
reCaptcha gibt es seit einem Jahr und bis jetzt wurden mehr als 1,2 Milliarden reCaptchas gelöst – dabei wurden 440 Millionen , für den Computer unlesbare Kombinationen, entziffert. Rechnet man dies zusammen, hätte man ungefährt 17600 Bücher, die mit reinem reCaptcha code gefüllt wurden!!! Wahnsinn, oder?
Alles in allem hilft reCaptcha also sowohl dem User, dem Admin und der Wissenschaft.
Ich werde mich in nächster Zeit für ein WordPress Plugin umschauen :-)
Auch wenn dieses “Bitte addiere 5+5″ sehr einfach ist, inwiefern Bots es knacken .. ich befürchte, sie tun es :-)
Seit Projektbeginn haben die Nutzer mehr als 1,2 Milliarden reCaptchas gelöst und dabei 440 Millionen für Computer unlesbare Wörter entschlüsselt. Das entspricht einer stattlichen Bibliothek mit 17.600 Bänden.
Täglich nutzen mehr Webmaster reCaptcha, womit dieser Index rasant ansteigt – gut so!
Was haltet ihr von reCaptcha? Findet ihr reCaptcha schwerer zu entziffern als normale Captchas oder umgekehrt? Schreibt euren Senf! Thx to Golem

15. August 2008 







tolle sache! captcha mal anders, praktisch recyclen! doch seitdem ich diesen beitrag gesehen hab: http://www.1ngo.de/web/captcha-spam.html find ich captchas völlig überflüssig! das recaptcha wär höchstens ne gute alternative! ;)
koellmanias last blog post..WordPress Update Hinweis unterdrücken
Mal ganz abgesehen von Eigenheiten techinischer Natur die das ganze ungemein erleichtern (schwarze Schrift auf weißem Hintergrund, “normale” Buchstaben) kommt hier noch hinzu, dass man Sachen wie ein Wörterbuch, oder in der heutigen Zeit vermutlich Wikipedia oder Google, verwenden um einem beim lösen der Aufgabe zu helfen.
Das klassiches OCR nicht klar kommt wenn ein Strich mitten durch das Wort durch geht, oder ein bzw. mehrere Buchstaben “zerstört” sind ist verständlich wenn man bedenkt, dass diese Systeme nicht darauf ausgelegt werden speziell solche eigenheiten zu Handhaben. Hinzu kommt auch noch das es bei OCR sinn macht einfach zu sagen “kenn ich nicht, löse es du bitte”, bei CAPTCHAs hingegen ist die Einstellung “egal, probieren kann man’s trozdem – kann nicht wesentlich mehr passieren als dass ich noch eines lösen muss”. Das kombiniert mit der Tatsache das einem eben Google/Wikipedia/Wörterbücher/etc. sowie die “normalität” der Zeichen (verglichen mit den Google-CAPTCHAs z.B.) beim “erraten” der richtigen Lösung helfen sind Sachen die das Projekt in die Kategorie “nett gemeint, aber leider nicht ganz so nützlich wie gehofft” einstufen lassen.
Btw, es freut mich, als Linzer, zu sehen dass sich im Bereich SEO nicht ganz so wenig tut wie einen die SERPs auf google.at vermuten lassen – weiter so! :)
Timmys last blog post..11.07.08: King.com – jeden Freitag ist FreeRoll Friday
/Sign :-)
Finds auch gut, nur wenn ich n capctha net sofort entziffern kann
mach ich ehrlich gesagt entweder audio ausgabe oder reloade das captcha :)