Το προφίλ μας στο Google Plus
9

Μα, είμαι άνθρωπος σου λέω!

Κάπου στο 1950, ο Alan Turing, με την ιδέα ότι μια μηχανή μπορεί να θεωρηθεί «έξυπνη» αν μέσω μιας συζήτησης καταφέρει να ξεγελάσει έναν άνθρωπο ως προς την φύση της (ανθρώπινη ή τεχνητή), πρότεινε κάποιες πρώτες δοκιμασίες με τις οποίες θα μπορούσαν να ελέγχονται οι μηχανές για να αποδείξουν ότι αξίζουν να ονομάζονται «νοήμονες». Οι δοκιμασίες αυτές, μαζί με άλλες που ακολούθησαν για τον ίδιο σκοπό, ονομάζονται πλέον δοκιμασίες Turing.

Αυτό που μάλλον δεν θα μπορούσε ποτέ να φανταστεί ο Turing είναι ότι, 70 περίπου χρόνια μετά, οι ρόλοι μηχανής – ανθρώπου θα αντιστρέφονταν και εκατομμύρια άνθρωποι θα υποβάλλονταν σε αρκετές αντίστροφες δοκιμασίες Turing καθημερινά από τις μηχανές, για να αποδείξουν κάτι που γι’ αυτούς είναι αυτονόητο… ότι είναι άνθρωποι! Οι δοκιμασίες αυτές ονομάζονται CAPTCHA.

Ο όρος CAPTCHA είναι ακρωνύμιο που προέρχεται από την φράση «Completely Automated Public Turing test to tell Computers and Human Apart». Ένα σύστημα CAPTCHA είναι ουσιαστικά ένα μέσο αυτόματης παραγωγής αντιστρόφων δοκιμασιών Turing που υπακούουν σε δύο βασικές αρχές:

  1. Μπορούν να ξεπεραστούν σχετικά εύκολα από ανθρώπους.
  2. Η κατασκευή κάποιου αλγορίθμου που έχει την δυνατότητα να τις ξεπεράσει είναι από πολύ δύσκολη έως αδύνατη.

Στις διάφορες σελίδες του internet μπορείτε να συναντήσετε πολλά είδη CAPTCHA αλλά η πιο διαδεδομένη μορφή είναι τα text based CAPTCHA. Σε αυτά, ο υπολογιστής που δρα ως server επιλέγει μια τυχαία λέξη και αφού την μετατρέψει σε εικόνα που παρουσιάζει στην σελίδα, ζητά από τον επισκέπτη να πληκτρολογήσει την λέξη που αναγνωρίζει βλέποντας την εικόνα. Εφόσον η λέξη που θα εισάγει ο επισκέπτης συμφωνεί με την τυχαία λέξη που επιλέχτηκε αρχικά, ο server υποθέτει ότι ο επισκέπτης είναι άνθρωπος και όχι κάποιο bot.
Δείγματα δοκιμασιών από μερικές από τις πιο δημοφιλείς υπηρεσίες του internet. Προσέξτε ότι όλες οι υλοποιήσεις δίνουν ιδιαίτερο βάρος πλέον στην υψηλή συγκέντρωση χαρακτήρων με μερική επικάλυψη ώστε να δυσκολέψουν την διαδικασία κατάτμησης.Το σύστημα βασίζεται στο γεγονός ότι ενώ είναι αρκετά εύκολο για ένα πρόγραμμα υπολογιστή να παράγει εικόνες που περιέχουν δοσμένο κείμενο, η αντίστροφη διαδικασία, δηλαδή η εξαγωγή σε μορφή κειμένου ενός αλφαριθμητικού που περιέχεται σε εικόνα (OCR – Optical Character Recognition) είναι αρκετά πιο δύσκολη διαδικασία. Μάλιστα, με σκοπό αυτή η διαδικασία να γίνει ακόμα δυσκολότερη, ένα σύστημα CAPTCHA μπορεί, ανάλογα με την υλοποίηση, να χρησιμοποιεί μια ή περισσότερες από τις παρακάτω τεχνικές:

  • Χρήση τυχαίων αλφαριθμητικών αντί επιλογής από πεπερασμένο σύνολο αναγνωρίσιμων λέξεων ώστε να μην μπορούν να χρησιμοποιηθούν λεξικά κατά την διαδικασία OCR.
  • Χρήση διαφορετικής γραμματοσειράς για κάθε εικόνα που δημιουργείται ή, για ακόμα μεγαλύτερη ασφάλεια, για κάθε χαρακτήρα στην εικόνα.
  • Χρήση διανυσματικών μετασχηματισμών σε κάθε χαρακτήρα ή στην συνολική εικόνα. Ανάλογα πάλι με την υλοποίηση, μπορεί να είναι απλοί και ευανάγνωστοι γραμμικοί μετασχηματισμοί (π.χ. περιστροφή) ή δυσκολότεροι μη-γραμμικοί (π.χ. warps και vortices).
  • Χρήση περίπλοκων μοτίβων (π.χ. θόρυβο ή πλέγμα) και χρωμάτων (gradients σε χρώματα όμοια με αυτά των γραμμάτων) στο φόντο.
  • Μερική επικάλυψη του κειμένου της εικόνας με παραμορφωμένες γραμμές strikethrough ή άλλα artifacts.
  • Υπερβολική συγκέντρωση των χαρακτήρων στην εικόνα ώστε ο κάθε χαρακτήρας να επικαλύπτει μέρος των διπλανών του.
  • Περιορισμός του χρονικού διαστήματος ισχύος της κάθε δοκιμασίας και αυτόματη αντικατάστασή της με άλλη όταν η προηγούμενη λήξει.
  • Χρονοκαθυστέρηση μετά από την πρώτη αποτυχημένη προσπάθεια λύσης της δοκιμασίας και γεωμετρική αύξηση της διάρκειάς της για κάθε αποτυχημένη προσπάθεια που ακολουθεί.

Η χρήση αυτών των τεχνικών και ο βαθμός ενσωμάτωσής τους στα διάφορα συστήματα CAPTCHA καθορίζουν σημαντικά την ομαλή λειτουργία τους. Στο internet συναντώνται συχνά κακές υλοποιήσεις που είτε χρησιμοποιούν παρανοϊκές ρυθμίσεις ασφάλειας παραβιάζοντας την 1η αρχή, είτε είναι πολύ χαλαρές παραβιάζοντας την 2η. Ένα καλό σύστημα CAPTCHA πρέπει να χαρακτηρίζεται από μια ισορροπία μεταξύ της ασφάλειας και της ευχρηστίας ώστε να τηρεί τις δύο βασικές αρχές.

Κακές υλοποιήσεις CAPTCHA - Αριστερά: Παραδείγματα δοκιμασιών που δίνοντας ιδιαίτερο βάρος στην 2η βασική αρχή παραβιάζουν την 1η καθιστώντας την λύση τους αδύνατη είτε από μηχανή, είτε από άνθρωπο. Δεξιά: Υπεραπλουστευμένες δοκιμασίες που μπορούν να αναγνωριστούν το ίδιο εύκολα από ανθρώπους και μηχανές.

Γιατί;

Ο χρήστης του internet έρχεται καθημερινά αντιμέτωπος με όλο και περισσότερες δοκιμασίες CAPTCHA και αυτό έχει αρχίσει να καταντά ενοχλητικό και κουραστικό. Υπολογίζεται ότι καθημερινά, οι άνθρωποι ξοδεύουν συνολικά 150.000 εργατοώρες για να αποδείξουν ότι δεν είναι μηχανές, λύνοντας περίπου 60 εκατομμύρια δοκιμασίες CAPTCHA. Οι λόγοι που οι ιδιοκτήτες ιστοτόπων αναγκάζονται να υποβάλλουν τους επισκέπτες τους σε αυτό το ενοχλητικό «σπορ» είναι κυρίως τα δύο «κακά παιδιά» του online marketing, το spam και το black hat SEO.
Οι spammers πρέπει να διαφημίσουν τα προϊόντα που αντιπροσωπεύουν μαζικά σε emails αλλά και σε forums, blogs, wikis, social networks καθώς και σε διάφορες άλλες online υπηρεσίες. Έτσι, κατασκευάζουν διάφορα bots, τα οποία ανάλογα με τον συγκεκριμένο σκοπό, αναλαμβάνουν είτε να σαρώνουν το internet για την συλλογή διευθύνσεων email, είτε να εκτελούν μαζική δημοσίευση διαφημιστικών σχολίων στις διάφορες υπηρεσίες, αφού πρώτα δημιουργήσουν αυτόματα τους ανάλογους λογαριασμούς που θα επιτρέψουν τις δημοσιεύσεις αυτές.   
Στον δε τομέα του black hat SEO, χρησιμοποιούνται τεχνικές παρόμοιες με τις παραπάνω για την δημιουργία συνδέσμων που οδηγούν σε συγκεκριμένους ιστοτόπους (backlinks), ανεβάζοντας έτσι το ranking που έχουν οι ιστοτόποι αυτοί στις διάφορες μηχανές αναζήτησης. Μάλιστα, με σκοπό την μαζική δημιουργία backlinks, πολλές φορές γίνεται χρήση bot για την αυτόματη δημιουργία αμέτρητων blog (π.χ. λογαριασμών σε Blogger και WordPress.com) που περιέχουν τους ανάλογους συνδέσμους. Άλλωστε, μια άλλη διαδεδομένη τεχνική black hat SEO είναι η χρήση bot για αυτόματη ψηφοφορία σε διάσημες υπηρεσίες content rating, όπως το digg, το technorati κ.λπ. 
Έτσι, οι δοκιμασίες CAPTCHA που συναντάτε κάθε φορά που θέλετε να σχολιάσετε μια δημοσίευση ενός blog ή να δημιουργήσετε ένα λογαριασμό σε μια online υπηρεσία και μερικές φορές όταν θέλετε να λάβετε μέρος σε μια ψηφοφορία ή να ζητήσετε την εμφάνιση κάποιας διεύθυνσης email σε μια σελίδα, έχουν σκοπό να εμποδίσουν τα διάφορα κακόβουλα bot.
Τέλος, υπάρχουν και συστήματα CAPTCHA που θα συναντήσετε σπάνια καθώς εγκαθίστανται στις διάφορες online υπηρεσίες ώστε να θέτουν όρια στην χρήση τους (rate limiting). Αυτό συμβαίνει γιατί διάφορα bots, προκειμένου να συλλέξουν μεγάλο όγκο πληροφοριών, κάνουν κατάχρηση των πόρων μιας υπηρεσίας. Ένα τέτοιο bot μπορεί να στέλνει εκατοντάδες queries ανά δευτερόλεπτο -λόγου χάρη- στην Wikipedia για να δημιουργήσει ένα τοπικό αντίγραφο όλων των πληροφοριών που περιέχονται σε αυτήν ή στο Google Maps για να δημιουργήσει τεράστιους, υψηλής ανάλυσης χάρτες. Έτσι, οι διαχειριστές τέτοιου είδους υπηρεσιών, προστατεύουν τους ιστοτόπους τους, κάνοντας χρήση συστημάτων CAPTCHA τα οποία ενεργοποιούνται μόνο όταν μια συγκεκριμένη διεύθυνση IP ζητά μεγάλο όγκο δεδομένων σε μικρό χρονικό διάστημα, γεγονός που είναι ένδειξη χρήσης bot.

Bypassing

Βέβαια, όπως όλα τα πράγματα, τα συστήματα CAPTCHA έχουν τις αδυναμίες τους και οι κάθε είδους «ενδιαφερόμενοι» χρησιμοποιούν τρείς –κυρίως- προσεγγίσεις για να τα ξεπεράσουν.

Η πρώτη προσέγγιση είναι εύκολη, ανέξοδη και ιδιαίτερα αποδοτική αλλά λειτουργεί μόνο σε συγκεκριμένα συστήματα CAPTCHA που διαθέτουν σοβαρά λάθη στην υλοποίησή τους (vulnerabilities). Μερικά παραδείγματα τέτοιων λαθών είναι:

  • Η μη-αποσύνδεση της αντιστοιχίας ενός session-ID με μια συγκεκριμένη δοκιμασία CAPTCHA μετά την επιτυχημένη λύση της. Σε αυτή την περίπτωση ο επιτιθέμενος λύνει πρώτα χειροκίνητα μια δοκιμασία CAPTCHA σημειώνοντας το session-ID από ένα cookie στον browser. Στην συνέχεια προγραμματίζει το bot του να χρησιμοποιεί το cookie με το συγκεκριμένο session-ID όταν «επισκέπτεται» την σελίδα ώστε να αντιμετωπίζει πάντα την ίδια δοκιμασία CAPTCHA, της οποίας η λύση είναι γνωστή.
  • Η αποστολή της λύσης της δοκιμασίας CAPTCHA στον client ως MD5 hash. Κάποιες υλοποιήσεις για να μην κάνουν χρήση cookie στέλνουν την MD5 hashed λύση μέσω ενός <input type=”hidden”> tag στην φόρμα υποβολής της λύσης. Το κάνουν αυτό ώστε με την υποβολή της φόρμας από τον επισκέπτη, να επιστρέψει στον server εκτός από την υποβαλλόμενη λύση και το hash της σωστής λύσης. Εκεί δημιουργείται το MD5 hash της λύσης που υποβλήθηκε και συγκρίνεται με το αρχικό hash για να επιβεβαιωθεί η σωστή λύση. Το πρόβλημα είναι ότι οι λύσεις είναι συνήθως μικρού μήκους και το MD5 hash τους μπορεί να σπάσει εύκολα.
  • Ο πλήρης διαχωρισμός του script ελέγχου του CAPTCHA με το script δημοσίευσης. Κλασικό παράδειγμα είναι η πλατφόρμα blogging WordPress. Οι διάφορες υλοποιήσεις CAPTCHA που υπάρχουν για αυτήν παρουσιάζουν δοκιμασίες CAPTCHA στην σελίδα υποβολής σχολίων. Έτσι, ο χρήστης υποβάλει το σχόλιό του μαζί με την λύση της δοκιμασίας και στην συνέχεια ένα plugin αναλαμβάνει να ελέγξει την ορθότητα της λύσης πριν προωθήσει το σχόλιο με την μέθοδο POST στο script wp-comments-post.php που αναλαμβάνει την δημοσίευση ενός σχολίου. Οι επιτιθέμενοι απλά προγραμματίζουν τα bots να στέλνουν τα σχόλιά τους απευθείας στο wp-comments-post.php με την μέθοδο POST, παρακάμπτοντας την σελίδα με την φόρμα υποβολής σχολίου και τον έλεγχο CAPTCHA.
  • Η χρήση προκατασκευασμένων, πεπερασμένου πλήθους δοκιμασιών CAPTCHA. Σε αυτή την περίπτωση, ο επιτιθέμενος απλά κατασκευάζει ένα bot το οποίο παρέχει κάποιου είδους training mode, όπως περίπου έχουν τα προγράμματα που εξάγουν υπότιτλους κειμένου από ταινίες DVD. Δηλαδή, κάθε φορά που το bot συναντά μια νέα δοκιμασία CAPTCHA, θα ζητά την χειροκίνητη λύση από τον χρήστη του, θα την χρησιμοποιεί άμεσα αλλά επιπλέον θα την αποθηκεύει για μελλοντική χρήση. Με την μέθοδο αυτή, αρχικά το bot θα ξεπερνά τα CAPTCHA πολύ αργά, αφού κάθε δοκιμασία θα είναι νέα, αλλά μετά από μερική ώρα «εκπαίδευσης» (ανάλογα με το μέγεθος του συνόλου δοκιμασιών που χρησιμοποιεί το συγκεκριμένο σύστημα CAPTCHA) θα ξεπερνά ένα μεγάλο ποσοστό δοκιμασιών γρήγορα και χωρίς την ανάγκη επίβλεψης.

Η δεύτερη προσέγγιση λειτουργεί ακόμα και στις πιο ασφαλείς υλοποιήσεις CAPTCHA, είναι εξίσου αποδοτική αλλά προϋποθέτει ανθρώπινη εργασία. Μέχρι στιγμής παρατηρούνται δύο τρόποι εκμετάλλευσης του ανθρώπινου δυναμικού:

  • Ο πληρωμένος. Ο spammer δημιουργεί ένα bot που αναλαμβάνει να κάνει αυτόματα όλες τις διαδικασίες που χρειάζονται (δημιουργία λογαριασμών, ανάρτηση δημοσιεύσεων και σχολίων κ.λπ.) εκτός από την λύση των δοκιμασιών CAPTCHA. Επίσης προσλαμβάνει εργάτες στους οποίους το bot ανακατευθύνει μαζικά τις δοκιμασίες CAPTCHA που συναντά κατά την λειτουργία του. Οι εργάτες πληρώνονται «με το κομμάτι» για να λύνουν την μια δοκιμασία μετά την άλλη και να στέλνουν τις λύσεις πίσω στο bot, το οποίο τις προωθεί στους αντίστοιχους ιστοτόπους ώστε να ξεπεράσει τις δοκιμασίες και να συνεχίσει απρόσκοπτα την δουλειά του. Ο τρόπος αυτός είναι και ο πιο διαδεδομένος ανάμεσα στις μεγάλες εταιρίες spam καθώς είναι πολύ αποδοτικός και σχεδόν αδύνατον να αντιμετωπιστεί.
  • Ο ανέξοδος. Πρόκειται για παραλλαγή του προηγούμενου τρόπου. Η διαφορά έγκειται στο ότι ο spammer αντί να προσλάβει ανθρώπους άμεσα, δημιουργεί έναν υψηλής κίνησης ιστοτόπο (προσφέρει κάτι δωρεάν, συνήθως πορνογραφικό περιεχόμενο) στον οποίο οι επισκέπτες προκαλούνται να λύσουν δοκιμασίες CAPTCHA ως αντίτιμο για κάποια υπηρεσία (π.χ. για κάθε δοκιμασία που λύνει ο επισκέπτης λαμβάνει μια εικόνα). Σε αυτόν τον τρόπο ωστόσο, η ικανοποιητική απόδοση του bypassing εξαρτάται σε πολύ μεγάλο βαθμό από την κίνηση του ιστοτόπου, η οποία δεν είναι ιδιαίτερα εύκολο να δημιουργηθεί.

CAPTCHA OCR – 1ο Στάδιο. Στο πρώτο στάδιο γίνεται συνήθως εκμετάλλευση της χρωματικής αντίθεσης (contrast) που υπάρχει μεταξύ των χαρακτήρων και του φόντου. Στο παράδειγμα της εικόνας (phpBB2) εφαρμόζεται αρχικά ένα downsample της εικόνας σε βάθος χρώματος 1-bit (ασπρόμαυρο) και στην συνέχεια ένα φίλτρο που τονίζει τα άκρα (edge stress).Η τρίτη προσέγγιση είναι η πιο δύσκολη στην υλοποίηση, έχει μέτρια αποδοτικότητα και αφορά την οπτική αναγνώριση χαρακτήρων (OCR). Φυσικά, εφόσον οι εικόνες  των δοκιμασιών CAPTCHA έχουν κατασκευαστεί με ακριβώς τέτοιο τρόπο, ώστε να δυσκολεύουν αυτή την προσέγγιση, οι συμβατικές μέθοδοι OCR είναι παντελώς άχρηστες. Οι αλγόριθμοι OCR που χρησιμοποιούνται για «σπάσουν» δοκιμασίες CAPTCHA επικεντρώνονται σε συγκεκριμένες υλοποιήσεις (π.χ. Google Mail CAPTCHA) και δεδομένης της εφαρμογής τους, θεωρούνται αποδοτικοί ακόμα και αν λύνουν μόνο ένα αρκετά χαμηλό ποσοστό δοκιμασιών. Παρά τις ειδικές διαφορές που μπορεί να έχουν ανάλογα με την υλοποίηση που στοχεύουν, όλοι αυτοί οι αλγόριθμοι δουλεύουν σε 3 κοινά στάδια:

  1. Αφαίρεση της άχρηστης πληροφορίας (φόντο, θόρυβος, artifacts κλπ).
  2. Κατάτμηση της εικόνας σε επιμέρους περιοχές, ώστε κάθε περιοχή να περιέχει ένα χαρακτήρα.
  3. Αναγνώριση του χαρακτήρα που περιέχεται σε κάθε περιοχή.

CAPTCHA OCR – 2ο Στάδιο. Η κατάτμηση της εικόνας στους επιμέρους χαρακτήρες επιτυγχάνεται με διάφορες μεθόδους. Στο παράδειγμα της εικόνας (MSN CAPTCHA προηγούμενης γενιάς) εφαρμόζεται η μέθοδος κάθετου ιστογράμματος (Vertical Histogram Segmentation) επιτυγχάνοντας μερική μόνο κατάτμηση. Στην συνέχεια, τα τμήματα που διαχωρίστηκαν με αυτόν τον τρόπο επεξεργάζονται περαιτέρω με άλλες μεθόδους (όπως η μέθοδος Color Filling Segmentation) ώστε να ολοκληρωθεί η κατάτμηση.Όσο και αν ακούγεται περίεργο, με την σημερινή υπολογιστική δύναμη των μηχανών και με τις διάφορες τεχνικές εκμάθησης που έχουν αναπτυχθεί για αυτές (όπως τα νευρωνικά δίκτυα), τα στάδια 1 και 3 υλοποιούνται αρκετά εύκολα και με τόσο μεγάλη απόδοση, ώστε οι χαρακτήρες να αναγνωρίζονται με μεγάλη επιτυχία και με ταχύτητα που μπορεί να ξεπερνά ακόμα και την ανθρώπινη.
Ο προσδιορισμός της θέσης ενός χαρακτήρα όμως, δηλαδή η κατάτμηση που γίνεται στο 2ο στάδιο, είναι ένα πρόβλημα που είναι ακόμα ιδιαίτερα δύσκολο και ακόμα και οι λίγες λύσεις που εμφανίστηκαν κατά καιρούς στο θέμα αυτό, ακόμα και αν προσέφεραν περιορισμένο βαθμό επιτυχίας, ήταν αρκετά «βαριές» υπολογιστικά.  Αυτό σημαίνει ότι ένα καλό σύστημα CAPTCHA πρέπει να δίνει ιδιαίτερο βάρος στην παραγωγή εικόνων που δυσκολεύουν όσο το δυνατόν περισσότερο την κατάτμηση.CAPTCHA OCR – 3ο Στάδιο. Εφόσον έχει ολοκληρωθεί η κατάτμηση, η αναγνώριση μεμονωμένων χαρακτήρων είναι πλέον θέμα ασήμαντης δυσκολίας για τους σύγχρονους αλγορίθμους OCR. Στον πίνακα της εικόνας μπορείτε να δείτε το ποσοστό επιτυχημένης αναγνώρισης που επιτυγχάνει ένας τέτοιος αλγόριθμος ανάλογα με το είδος παραμόρφωσης που έχει υποστεί ο χαρακτήρας.

Το «σπάσιμο» των διάφορων text based CAPTCHA λοιπόν, δεν είναι αδύνατο. Άλλωστε κατά καιρούς, συστήματα CAPTCHA που προστατεύουν τις πιο διάσημες υπηρεσίες έχουν παραβιαστεί (Google, Yahoo! και Microsoft Live Μail, PayPal, LiveJournal, phpBB κ.α.). Μάλιστα, για μεγαλύτερη προστασία, εμφανίζονται όλο και περισσότερες λύσεις CAPTCHA που δεν βασίζονται σε κείμενο, όπως είναι τα CAPTCHA αναγνώρισης εικόνων (Microsoft Asirra, KittenAuth), τα 3D CAPTCHA ή τα targeted CAPTCHA που απευθύνονται σε ανθρώπους με συγκεκριμένο γνωστικό υπόβαθρο όπως τα Mathematical CAPTCHA.Παραδείγματα εναλλακτικών συστημάτων CAPTCHA που δεν βασίζονται στην αναγνώριση κειμένου.
Είναι πάντως ενδιαφέρον να αναρωτηθούμε τι θα συμβεί όταν η εξέλιξη των μηχανών θα έχει σαν αποτέλεσμα κάποτε την αχρήστευση όλων των αντίστροφων δοκιμασιών Turing. Τι άλλο θα πρέπει να κάνουμε τότε για να αποδείξουμε ότι είμαστε άνθρωποι και όχι μηχανές; Ή μήπως τότε ο διαχωρισμός αυτός θα έχει μικρή σημασία…;

ReCAPTCHA – Stop spam, read books

ReCAPTCHAΤο ReCAPTCHA είναι ένα σύστημα text based CAPTCHA με μια ενδιαφέρουσα καινοτομία: βοηθάει στην ψηφιοποίηση βιβλίων που περιέχουν λέξεις που αναγνωρίζονται δύσκολα από τα συμβατικά προγράμματα OCR.
Συγκεκριμένα, στον επισκέπτη μιας σελίδας που χρησιμοποιεί το σύστημα ReCAPTCHA, παρουσιάζεται μια εικόνα που περιέχει δύο λέξεις. Η μια λέξη έχει επιλεχθεί τυχαία και είναι γνωστή στο σύστημα ReCAPTCHA, όπως συμβαίνει και στα υπόλοιπα συστήματα CAPTCHA. Η άλλη λέξη όμως δεν είναι γνωστή στο σύστημα καθώς πρόκειται για εικόνα που προέκυψε από ψηφιακή σάρωση κάποιου βιβλίου.
Από τον επισκέπτη ζητιέται η εισαγωγή και των δύο λέξεων αλλά ουσιαστικά, αφού το ReCAPTCHA γνωρίζει μόνο την μια λέξη, μόνο η μια απ’ τις λέξεις που εισάγει ο επισκέπτης αποτελεί λύση δοκιμασίας CAPTCHA και αυτή είναι ουσιαστικά που χρησιμοποιείται για την διάκριση μεταξύ ανθρώπου και μηχανής. Αν ο επισκέπτης λύσει με επιτυχία την δοκιμασία αυτή, τότε το σύστημα του δίνει πρόσβαση στην ανάλογη υπηρεσία και θεωρεί ότι και η δεύτερη λέξη αναγνωρίστηκε σωστά, πετυχαίνοντας έτσι την αναγνώριση μιας άγνωστης λέξης. Βέβαια, για μεγαλύτερη ασφάλεια, οι άγνωστες λέξεις που αναγνωρίζονται από επισκέπτες επαληθεύονται και σε επόμενες δοκιμασίες. Μετά την επαλήθευσή τους, καταχωρούνται στο σύστημα ως γνωστές λέξεις και χρησιμοποιούνται πλέον ως δοκιμασίες μαζί με κάποια άλλη άγνωστη λέξη.
Το σύστημα ReCAPTCHA έχει αποκτήσει μεγάλη δημοτικότητα και δεδομένου ότι καθημερινά λύνονται πάνω από 30 εκατομμύρια δοκιμασίες, βοηθά σημαντικά στην ψηφιοποίηση βιβλίων μετατρέποντας μια απλά ενοχλητική διαδικασία σε ωφέλιμη.

9 Responses to “Μα, είμαι άνθρωπος σου λέω!”

  1. ^^TnT^^ | 19/09/2011 at 12:20

    Ενδιαφέρον :) Πολύ ενδιαφέρον…

  2. undefined | 19/09/2011 at 15:26

    Αν έγραφα κατεβατό κείμενο και στο τέλος μου έβγαζε να λύσω MAPTCHA θα τους έβριζα

  3. 41i3n | 19/09/2011 at 16:40

    I failed the Turing test :-(

  4. CodeBr4k3R | 19/09/2011 at 21:44

    “Maptcha”… kickass ;)
    Αυτά θέλουμε !! :D

  5. sigma | 19/09/2011 at 22:43

    αυτο ακριβως ελεγα σε ενα αλλο θεμα :)

  6. firstroad | 28/12/2011 at 01:28

    κάποτε καθώς έψαχνα με τον αγαπητό google είχα βρει αρκετές υπηρεσίες που έκαναν bypass είτε σε συγκεκριμένες υπηρεσίες (recaptcha ας πούμε) είτε σε πολλές, πάντως ουδέ μία δωρεάν, τώρα… κατά πόσο έμπιστες είναι δεν ξέρω (έχω δει τρομερά ποσά του τύπου 130$ για 20k bypasses)

    • subZraw | 28/12/2011 at 12:21

      Δεν μπορώ να είμαι σίγουρος, όμως λίγο “snake oil” μου ακούγονται κάτι τέτοιες υπηρεσίες. Αλλά και να μην είναι, σε ποιους άραγε απευθύνονται; (Spammers come in mind…)

Leave a Reply

You must be logged in to post a comment.

Σύνδεση

Αρχείο δημοσιεύσεων