Προγραμματισμός

Τι είναι η αναγνώριση προσώπου; AI για τον Big Brother

Μπορεί ο Big Brother να αναγνωρίσει το πρόσωπό σας από την παρακολούθηση CCTV σε επίπεδο δρόμου και να πει εάν είστε χαρούμενοι, λυπημένοι ή θυμωμένοι; Μπορεί αυτή η ταυτοποίηση να οδηγήσει στη σύλληψή σας με εκκρεμό ένταλμα; Ποιες είναι οι πιθανότητες ότι η αναγνώριση είναι λανθασμένη και συνδέεται πραγματικά με κάποιον άλλο; Μπορείτε να νικήσετε την επιτήρηση χρησιμοποιώντας εντελώς κάποιο κόλπο;

Από την άλλη πλευρά, μπορείτε να μπείτε σε ένα θησαυροφυλάκιο που προστατεύεται από ένα λογισμικό κάμερας και αναγνώρισης προσώπου κρατώντας πατημένο το αντίγραφο ενός προσώπου εξουσιοδοτημένου ατόμου; Τι γίνεται αν φοράτε μια τρισδιάστατη μάσκα προσώπου εξουσιοδοτημένου ατόμου;

Καλώς ήρθατε στην αναγνώριση προσώπου - και στην πλαστογράφηση της αναγνώρισης προσώπου.

Τι είναι η αναγνώριση προσώπου;

Η αναγνώριση προσώπου είναι μια μέθοδος για την ταυτοποίηση ενός άγνωστου ατόμου ή την επικύρωση της ταυτότητας ενός συγκεκριμένου ατόμου από το πρόσωπό του. Είναι ένας κλάδος της όρασης του υπολογιστή, αλλά η αναγνώριση προσώπου είναι εξειδικευμένη και συνοδεύεται από κοινωνικές αποσκευές για ορισμένες εφαρμογές, καθώς και ορισμένες ευπάθειες στην πλαστογράφηση.

Πώς λειτουργεί η αναγνώριση προσώπου;

Οι αλγόριθμοι πρώιμης αναγνώρισης προσώπου (που εξακολουθούν να χρησιμοποιούνται σήμερα σε βελτιωμένη και πιο αυτοματοποιημένη μορφή) βασίζονται σε βιομετρικά στοιχεία (όπως η απόσταση μεταξύ των ματιών) για να μετατρέψουν τα μετρημένα χαρακτηριστικά του προσώπου από μια δισδιάστατη εικόνα σε ένα σύνολο αριθμών (ένα χαρακτηριστικό φορέα ή πρότυπο) που περιγράφει το πρόσωπο. Στη συνέχεια, η διαδικασία αναγνώρισης συγκρίνει αυτά τα διανύσματα με μια βάση δεδομένων γνωστών προσώπων που έχουν χαρτογραφηθεί με χαρακτηριστικά με τον ίδιο τρόπο. Μία επιπλοκή σε αυτήν τη διαδικασία είναι η προσαρμογή των προσώπων σε μια κανονικοποιημένη προβολή για να ληφθεί υπόψη η περιστροφή και η κλίση της κεφαλής πριν από την εξαγωγή των μετρήσεων. Αυτή η κατηγορία αλγορίθμων ονομάζεται γεωμετρικός.

Μια άλλη προσέγγιση για την αναγνώριση προσώπου είναι να ομαλοποιήσετε και να συμπιέσετε 2-D εικόνες προσώπου και να τις συγκρίνετε με μια βάση δεδομένων με ομοιόμορφες και συμπιεσμένες εικόνες. Αυτή η κατηγορία αλγορίθμων ονομάζεται φωτομετρικός.

Η τρισδιάστατη αναγνώριση προσώπου χρησιμοποιεί αισθητήρες 3-D για τη λήψη της εικόνας του προσώπου ή ανακατασκευάζει την εικόνα 3-D από τρεις κάμερες παρακολούθησης 2-D που έχουν επισημανθεί σε διαφορετικές γωνίες. Η αναγνώριση προσώπου 3-D μπορεί να είναι πολύ πιο ακριβής από την αναγνώριση 2-D.

Η ανάλυση της υφής του δέρματος χαρτογραφεί τις γραμμές, τα μοτίβα και τα σημεία στο πρόσωπο ενός ατόμου σε ένα άλλο φορέα χαρακτηριστικών. Η προσθήκη ανάλυσης υφής δέρματος σε αναγνώριση προσώπου 2-D ή 3-D μπορεί να βελτιώσει την ακρίβεια της αναγνώρισης κατά 20 έως 25 τοις εκατό, ειδικά στις περιπτώσεις μοιάζουν και δίδυμα. Μπορείτε επίσης να συνδυάσετε όλες τις μεθόδους και να προσθέσετε πολυφασματικές εικόνες (ορατό φως και υπέρυθρες ακτίνες), για ακόμη μεγαλύτερη ακρίβεια.

Η αναγνώριση προσώπου βελτιώνεται χρόνο με το χρόνο από τότε που ξεκίνησε το πεδίο το 1964. Κατά μέσο όρο, το ποσοστό σφάλματος μειώνεται κατά το ήμισυ κάθε δύο χρόνια.

Σχετικό βίντεο: Πώς λειτουργεί η αναγνώριση προσώπου

Δοκιμές πωλητή αναγνώρισης προσώπου

Το NIST, το Εθνικό Ινστιτούτο Προτύπων και Τεχνολογίας των ΗΠΑ, πραγματοποιεί δοκιμές αλγορίθμων αναγνώρισης προσώπου, το Face Recognition Vendor Test (FRVT), από το 2000. Τα σύνολα δεδομένων εικόνων που χρησιμοποιούνται είναι κυρίως κούπες επιβολής του νόμου, αλλά περιλαμβάνουν επίσης in-the- άγριες ακίνητες εικόνες, όπως αυτές που βρίσκονται στο Wikimedia και εικόνες χαμηλής ανάλυσης από κάμερες.

Οι αλγόριθμοι FRVT υποβάλλονται κυρίως από εμπορικούς προμηθευτές. Οι συγκρίσεις από έτος σε έτος δείχνουν σημαντικά κέρδη στην απόδοση και την ακρίβεια. Σύμφωνα με τους πωλητές, αυτό οφείλεται κυρίως στη χρήση βαθιών συνελικτικών νευρικών δικτύων.

Σχετικά προγράμματα δοκιμών αναγνώρισης προσώπου NIST έχουν μελετήσει δημογραφικά αποτελέσματα, ανίχνευση μορφοποίησης προσώπου, αναγνώριση προσώπων που δημοσιεύονται στα κοινωνικά μέσα και αναγνώριση προσώπων σε βίντεο. Μια προηγούμενη σειρά δοκιμών διεξήχθη στη δεκαετία του 1990 με ένα διαφορετικό moniker, Face Recognition Technology (FERET).

ΝΙΣΤ

Εφαρμογές αναγνώρισης προσώπου

Οι εφαρμογές αναγνώρισης προσώπου εμπίπτουν κυρίως σε τρεις μεγάλες κατηγορίες: ασφάλεια, υγεία και μάρκετινγκ / λιανική. Η ασφάλεια περιλαμβάνει την επιβολή του νόμου και αυτή η κατηγορία χρήσεων αναγνώρισης προσώπου μπορεί να είναι τόσο καλοήθης όσο ταιριάζει με τις φωτογραφίες διαβατηρίων τους γρηγορότερα και με μεγαλύτερη ακρίβεια από ό, τι οι άνθρωποι, και τόσο ανατριχιαστικό όσο το σενάριο "Πρόσωπο ενδιαφέροντος" όπου οι άνθρωποι παρακολουθούνται μέσω CCTV και συγκρίνονται σε ταξινομημένες βάσεις δεδομένων φωτογραφιών. Η ασφάλεια χωρίς επιβολή νόμου περιλαμβάνει κοινές εφαρμογές, όπως ξεκλείδωμα προσώπου για κινητά τηλέφωνα και έλεγχο πρόσβασης για εργαστήρια και θησαυροφυλάκια.

Οι εφαρμογές υγείας της αναγνώρισης προσώπου περιλαμβάνουν check-in ασθενούς, ανίχνευση συναισθημάτων σε πραγματικό χρόνο, παρακολούθηση ασθενών μέσα σε μια εγκατάσταση, αξιολόγηση των επιπέδων πόνου σε μη λεκτικούς ασθενείς, ανίχνευση ορισμένων ασθενειών και καταστάσεων, αναγνώριση προσωπικού και ασφάλεια των εγκαταστάσεων. Οι εφαρμογές μάρκετινγκ και λιανικής αναγνώρισης προσώπου περιλαμβάνουν αναγνώριση των μελών του προγράμματος αφοσίωσης, αναγνώριση και παρακολούθηση γνωστών καταστημάτων καταστημάτων και αναγνώριση των ανθρώπων και των συναισθημάτων τους για στοχευμένες προτάσεις προϊόντων.

Διαφωνίες αναγνώρισης προσώπου, προκαταλήψεις και απαγορεύσεις

Το να πούμε ότι ορισμένες από αυτές τις εφαρμογές είναι αμφιλεγόμενες θα ήταν υποτιμητική. Όπως συζητά ένα άρθρο του New York Times για το 2019, η αναγνώριση προσώπου στράφηκε σε διαμάχη, από τη χρήση του για παρακολούθηση σταδίων έως το ρατσιστικό λογισμικό.

Επιτήρηση σταδίου; Η αναγνώριση προσώπου χρησιμοποιήθηκε στο Super Bowl του 2001: το λογισμικό προσδιόρισε 19 άτομα που θεωρούνταν ότι αποτελούν αντικείμενο εκκρεμών ενταλμάτων, αν και κανένα δεν συνελήφθη (όχι λόγω έλλειψης προσπάθειας).

Ρατσιστικό λογισμικό; Υπήρξαν πολλά ζητήματα, ξεκινώντας από το λογισμικό παρακολούθησης προσώπων του 2009 που θα μπορούσε να παρακολουθεί τα λευκά αλλά όχι τα Μαύρα και να συνεχίσει με τη μελέτη MIT του 2015 που έδειξε ότι το λογισμικό αναγνώρισης προσώπου της εποχής λειτούργησε πολύ καλύτερα σε λευκά αρσενικά πρόσωπα από ό, τι οι γυναίκες ή / και Μαύρα πρόσωπα.

Αυτά τα είδη ζητημάτων έχουν οδηγήσει σε πλήρη απαγόρευση του λογισμικού αναγνώρισης προσώπου σε συγκεκριμένα μέρη ή για συγκεκριμένες χρήσεις. Το 2019, το Σαν Φρανσίσκο έγινε η πρώτη μεγάλη αμερικανική πόλη που εμπόδισε την αστυνομία και άλλες υπηρεσίες επιβολής του νόμου να χρησιμοποιούν λογισμικό αναγνώρισης προσώπου. Η Microsoft ζήτησε ομοσπονδιακούς κανονισμούς για την αναγνώριση προσώπου. και το MIT έδειξαν ότι το Amazon Recognition είχε μεγαλύτερο πρόβλημα να προσδιορίσει το γυναικείο φύλο από το ανδρικό φύλο από τις εικόνες προσώπου, καθώς και περισσότερα προβλήματα με το μαύρο θηλυκό φύλο από το λευκό θηλυκό φύλο.

Τον Ιούνιο του 2020, η Microsoft ανακοίνωσε ότι δεν θα πουλήσει και δεν έχει πουλήσει το λογισμικό αναγνώρισης προσώπου στην αστυνομία. Η Amazon απαγόρευσε στην αστυνομία τη χρήση της αναγνώρισης για ένα έτος. και η IBM εγκατέλειψε την τεχνολογία αναγνώρισης προσώπου. Η απαγόρευση της αναγνώρισης προσώπων εντελώς δεν θα είναι εύκολη, ωστόσο, δεδομένης της ευρείας υιοθέτησής της σε iPhone (Face ID) και σε άλλες συσκευές, λογισμικό και τεχνολογίες.

Δεν έχουν όλα τα λογισμικά αναγνώρισης προσώπου τις ίδιες προκαταλήψεις. Η μελέτη δημογραφικών εφέ NIST του 2019 παρακολούθησε το έργο MIT και έδειξε ότι η αλγοριθμική δημογραφική μεροληψία ποικίλλει σημαντικά μεταξύ των προγραμματιστών λογισμικού αναγνώρισης προσώπου. Ναι, υπάρχουν δημογραφικές επιδράσεις στο ψευδές ποσοστό αντιστοίχισης και στο ψευδές ποσοστό αντιστοίχισης των αλγορίθμων αναγνώρισης προσώπου, αλλά μπορεί να ποικίλλουν ανάλογα με διάφορες τάξεις μεγέθους από πωλητή σε πωλητή και μειώνονται με την πάροδο του χρόνου.

Παραβίαση αναγνώρισης προσώπου και τεχνικές κατά της πλαστογράφησης

Λαμβάνοντας υπόψη την πιθανή απειλή απορρήτου από την αναγνώριση προσώπου και την έλξη πρόσβασης σε πόρους υψηλής αξίας που προστατεύονται από τον έλεγχο ταυτότητας προσώπου, έχουν γίνει πολλές προσπάθειες για hacking ή πλαστογράφηση της τεχνολογίας. Μπορείτε να παρουσιάσετε μια εκτυπωμένη εικόνα ενός προσώπου αντί για ένα ζωντανό πρόσωπο, ή μια εικόνα σε μια οθόνη ή μια τρισδιάστατη τυπωμένη μάσκα, για να περάσετε τον έλεγχο ταυτότητας. Για παρακολούθηση CCTV, μπορείτε να αναπαράγετε ένα βίντεο. Για να αποφύγετε την παρακολούθηση, μπορείτε να δοκιμάσετε τα υφάσματα και το μακιγιάζ "CV Dazzle" και / ή τους πομπούς IR, για να ξεγελάσετε το λογισμικό ώστε να μην ανιχνεύει το πρόσωπό σας.

Φυσικά, υπάρχουν προσπάθειες για την ανάπτυξη τεχνικών anti-spoofing για όλες αυτές τις επιθέσεις. Για την ανίχνευση εκτυπωμένων εικόνων, οι πωλητές χρησιμοποιούν μια δοκιμή ζωτικότητας, όπως η αναμονή για το θέμα να αναβοσβήνει, ή να εκτελούν ανάλυση κίνησης ή να χρησιμοποιούν υπέρυθρες για να διακρίνουν ένα ζωντανό πρόσωπο από μια εκτυπωμένη εικόνα. Μια άλλη προσέγγιση είναι η πραγματοποίηση ανάλυσης μικρο-υφής, καθώς το ανθρώπινο δέρμα είναι οπτικά διαφορετικό από τις εκτυπώσεις και τα υλικά μάσκας. Οι τελευταίες τεχνικές anti-spoofing βασίζονται κυρίως σε βαθιά συνελικτικά νευρικά δίκτυα.

Αυτό είναι ένα εξελισσόμενο πεδίο. Υπάρχει ένας πόλεμος όπλων μεταξύ επιτιθέμενων και λογισμικού anti-spoofing, καθώς και ακαδημαϊκή έρευνα σχετικά με την αποτελεσματικότητα διαφορετικών τεχνικών επίθεσης και άμυνας.

Προμηθευτές αναγνώρισης προσώπου

Σύμφωνα με το Electronic Frontier Foundation, η MorphoTrust, θυγατρική της Idemia (παλαιότερα γνωστή ως OT-Morpho ή Safran), είναι ένας από τους μεγαλύτερους πωλητές αναγνώρισης προσώπου και άλλων τεχνολογιών βιομετρικών ταυτοποίησης στις Ηνωμένες Πολιτείες. Έχει σχεδιάσει συστήματα για κρατικά DMVs, ομοσπονδιακές και πολιτειακές υπηρεσίες επιβολής του νόμου, έλεγχο των συνόρων και αεροδρόμια (συμπεριλαμβανομένου του TSA PreCheck) και του κρατικού υπουργείου. Άλλοι συνηθισμένοι προμηθευτές περιλαμβάνουν τα 3M, Cognitec, DataWorks Plus, Dynamic Imaging Systems, FaceFirst και NEC Global.

Το NIST Face Recognition Vendor Test παραθέτει αλγόριθμους από πολλούς περισσότερους προμηθευτές από όλο τον κόσμο. Υπάρχουν επίσης διάφοροι αλγόριθμοι αναγνώρισης προσώπου ανοιχτού κώδικα, διαφορετικής ποιότητας, και μερικές σημαντικές υπηρεσίες cloud που προσφέρουν αναγνώριση προσώπου.

Το Amazon Recognition είναι μια υπηρεσία ανάλυσης εικόνας και βίντεο που μπορεί να προσδιορίσει αντικείμενα, άτομα, κείμενο, σκηνές και δραστηριότητες, συμπεριλαμβανομένης της ανάλυσης προσώπου και προσαρμοσμένων ετικετών. Το Google Cloud Vision API είναι μια προκαθορισμένη υπηρεσία ανάλυσης εικόνων που μπορεί να ανιχνεύσει αντικείμενα και πρόσωπα, να διαβάσει έντυπα και χειρόγραφα κείμενα και να δημιουργήσει μεταδεδομένα στον κατάλογο εικόνων σας. Το Google AutoML Vision σάς επιτρέπει να εκπαιδεύετε προσαρμοσμένα μοντέλα εικόνων.

Το Azure Face API κάνει ανίχνευση προσώπου που αντιλαμβάνεται πρόσωπα και χαρακτηριστικά σε μια εικόνα, εκτελεί ταυτοποίηση προσώπου που ταιριάζει με ένα άτομο στον ιδιωτικό σας χώρο αποθήκευσης έως 1 εκατομμύριο άτομα και εκτελεί αναγνώριση συναισθημάτων. Το Face API μπορεί να εκτελεστεί στο cloud ή στην άκρη σε κοντέινερ.

Σύνολα δεδομένων προσώπου για εκπαίδευση αναγνώρισης

Υπάρχουν δεκάδες σύνολα δεδομένων προσώπου διαθέσιμα για λήψη που μπορούν να χρησιμοποιηθούν για εκπαίδευση αναγνώρισης. Δεν είναι όλα τα σύνολα δεδομένων προσώπου: Τείνουν να ποικίλλουν στο μέγεθος της εικόνας, στον αριθμό των ατόμων που αντιπροσωπεύονται, στον αριθμό των εικόνων ανά άτομο, στις συνθήκες των εικόνων και στον φωτισμό. Η επιβολή του νόμου έχει επίσης πρόσβαση σε μη δημόσια σύνολα δεδομένων προσώπου, όπως τρέχοντα mugshots και εικόνες άδειας οδήγησης.

Ορισμένες από τις μεγαλύτερες βάσεις δεδομένων προσώπου είναι Labeled Faces in the Wild, με ~ 13K μοναδικούς ανθρώπους. FERET, που χρησιμοποιείται για τις πρώτες δοκιμές NIST. τη βάση δεδομένων Mugshot που χρησιμοποιείται στο NIST FRVT που βρίσκεται σε εξέλιξη · η βάση δεδομένων κάμερας παρακολούθησης SCFace, επίσης διαθέσιμη με ορόσημα προσώπου · και με ετικέτα πρόσωπα Wikipedia, με ~ 1.5K μοναδικές ταυτότητες. Αρκετές από αυτές τις βάσεις δεδομένων περιέχουν πολλές εικόνες ανά ταυτότητα. Αυτή η λίστα από τον ερευνητή Ethan Meyers προσφέρει κάποιες συνετές συμβουλές σχετικά με την επιλογή ενός συνόλου δεδομένων προσώπου για έναν συγκεκριμένο σκοπό.

Εν ολίγοις, η αναγνώριση προσώπου βελτιώνεται και οι προμηθευτές μαθαίνουν να εντοπίζουν τις περισσότερες πλαστογραφίες, αλλά ορισμένες εφαρμογές της τεχνολογίας είναι αμφιλεγόμενες. Το ποσοστό σφάλματος για την αναγνώριση προσώπου μειώνεται στο ήμισυ κάθε δύο χρόνια, σύμφωνα με το NIST. Οι προμηθευτές έχουν βελτιώσει τις τεχνικές τους κατά της πλαστογράφησης ενσωματώνοντας συνελικτικά νευρικά δίκτυα.

Εν τω μεταξύ, υπάρχουν πρωτοβουλίες για την απαγόρευση της χρήσης αναγνώρισης προσώπου στην παρακολούθηση, ειδικά από την αστυνομία. Ωστόσο, η απαγόρευση της αναγνώρισης προσώπων εντελώς θα ήταν δύσκολη, δεδομένου του πόσο διαδεδομένη έχει γίνει.

Διαβάστε περισσότερα για τη μηχανική μάθηση και τη βαθιά μάθηση:

  • Βαθιά μάθηση έναντι μηχανικής μάθησης: Κατανοήστε τις διαφορές
  • Τι είναι η μηχανική μάθηση; Πληροφορίες που προέρχονται από δεδομένα
  • Τι είναι η βαθιά μάθηση; Αλγόριθμοι που μιμούνται τον ανθρώπινο εγκέφαλο
  • Εξήγησαν οι αλγόριθμοι μηχανικής μάθησης
  • Η αυτόματη μηχανική εκμάθηση ή η AutoML εξηγείται
  • Εξηγείται η εποπτευόμενη μάθηση
  • Εξήγησε ημι-εποπτευόμενη μάθηση
  • Η μη επιτηρούμενη μάθηση εξηγείται
  • Η μάθηση ενίσχυσης εξηγείται
  • Τι είναι το όραμα του υπολογιστή; AI για εικόνες και βίντεο
  • Τι είναι η αναγνώριση προσώπου; AI για τον Big Brother
  • Τι είναι η επεξεργασία φυσικής γλώσσας; AI για ομιλία και κείμενο
  • Kaggle: Πού μαθαίνουν και ανταγωνίζονται οι επιστήμονες δεδομένων
  • Τι είναι το CUDA; Παράλληλη επεξεργασία για GPU