Προγραμματισμός

Ενα πληκτρολόγιο? Πόσο περίεργο

Η εποχή της φωνητικής αναζήτησης και του λογισμικού που λειτουργεί με φωνή είναι πάνω μας. Ως προγραμματιστής ζω και πεθαίνω από το πληκτρολόγιο, αλλά μπορώ ήδη να δω τα σημάδια: Όπως πολλοί άνθρωποι, για παράδειγμα, μιλάω στο τηλέφωνό μου Android (για παράδειγμα, "Navigate to Lowes [or Starbucks or Harris Teeter]") για Πάρε οδηγίες.

Στην Αναφορά Τάσεων Διαδικτύου της Mary Meeker's 2016, αναφέρει ότι τα ερωτήματα αναζήτησης του Google Voice έχουν αυξηθεί κατά 7 φορές από το 2010. Παρατήρησα επίσης ότι ο 12χρονος γιος μου κάνει σχεδόν όλες τις αναζητήσεις του μέσω φωνής - και μου Η φίλη μου στείλει τακτικά με αυτόν τον τρόπο τακτικά. Επίσης, η εταιρεία στην οποία εργάζομαι, η Lucidworks, ανακοίνωσε πρόσφατα μια νέα συνεργασία με την IBM για την ενσωμάτωση των δυνατοτήτων Watson και text-to-speech στο προϊόν εταιρικής αναζήτησης.

Η τεχνολογία λειτουργεί πολύ καλύτερα από ό, τι στο παρελθόν και είναι πιο εύκολο να ενσωματωθεί σε εφαρμογές. Εάν αναπτύξετε για Android ή iOS, μπορείτε εύκολα να συνδεθείτε στα API για αναγνώριση ομιλίας. Αλλά η αναγνώριση ομιλίας δεν ξεκινά και τελειώνει με απλές εντολές ομιλίας σε κείμενο και φωνής.

Η κατανόηση του σκοπού της αναζήτησης είναι μια πολύ συμφραζόμενη εργασία, ειδικά με την ομιλούμενη γλώσσα. Επιπλέον, οι άνθρωποι τείνουν να χρησιμοποιούν περισσότερες λέξεις στη φυσική ομιλούμενη γλώσσα παρά όταν έρχονται αντιμέτωποι με μια γραμμή αναζήτησης. Υπάρχουν περισσότερες "λέξεις θορύβου" στην προφορική γλώσσα παρά σε μια κανονική αναζήτηση με κείμενο.

Αυτές είναι σημαντικές προκλήσεις AI. Αλλά καθώς ξεπερνάμε το πρόβλημα περιβάλλοντος, οι προγραμματιστές θα μάθουν ότι περισσότερα μπορούν να γίνουν με φωνή παρά με κείμενο. Το συναισθηματικό πλαίσιο θα παίξει ρόλο. Αν ψάχνετε για βενζινάδικο, θέλετε το φθηνότερο ή το πλησιέστερο; Το συναισθηματικό περιεχόμενο της φωνής σας θα μπορούσε να υπονοεί αυτό. Σίγουρα, μπορεί να διευκρινίσετε, αλλά ίσως να μην χρειάζεται.

Το ομιλητικό σου μέλλον

Η φωνητική εποχή δεν αφορά μόνο την αναζήτηση. Θα επηρεάσει ολόκληρο τον τρόπο αλληλεπίδρασης με τους υπολογιστές. Στο όχι και τόσο μακρινό μέλλον, τα πληκτρολόγια θα θεωρηθούν «περίεργα», όπως τα περιέγραψε ο Σκότι στο «Star Trek IV».

Αλλά αυτή η αλλαγή απαιτεί επίσης ένα εντελώς νέο περιβάλλον εργασίας χρήστη. Εδώ είναι μια αρχαία εικόνα του τι εννοώ: Όταν βγήκαν τα Windows 95, η IBM είχε ενσωματώσει φωνητικές εντολές στους υπολογιστές της. Εκείνη την εποχή, δούλευα ως πωλητής στο Office Depot, και έγινε γρήγορα εμφανές πόσο άχρηστες ήταν οι φωνητικές εντολές. Η διεπαφή με παράθυρο δεν προσφέρθηκε καθόλου σε αυτήν τη μορφή αλληλεπίδρασης.

Θέλω να πω, τι διάολο μετακινείτε ένα παράθυρο έξω από το δρόμο ενός άλλου παραθύρου και αλλάζετε το μέγεθος και των δύο για να ταιριάζουν στην οθόνη με αποτελεσματικό τρόπο με φωνητικές εντολές; Δεν το κάνεις. Απομακρύνετε εντελώς αυτά τα παράθυρα (και πιθανώς τα Windows). Ένα UI με φωνή δεν χρησιμοποιεί τα ίδια μοτίβα. Δεν βλέπετε ποτέ μια διεπαφή με παράθυρο στο "Star Trek".

Μιλώντας για το "Star Trek", όταν οι άνθρωποι αρχίζουν να κωδικοποιούν ή κάνουν κάτι τεχνικό, πάντοτε μεταβαίνουν σε μια αφής διεπαφή (ΟΚ, όχι ακριβώς αφής - μοιάζει περισσότερο με ένα πληκτρολόγιο μικροκυμάτων επικαλυμμένο με αρ νουβό αποδόσεις ενός κυκλώματος). Είναι όμως απαραίτητη η παλινδρόμηση για "πληκτρολόγηση"; Είναι αλήθεια ότι δεν μπορώ να φανταστώ τη χρήση μιας φωνητικής διεπαφής για κωδικοποίηση στη Scala. Ίσως θα αναπτυχθούν νέες γλώσσες (χωρίς παρενθέσεις, σε αντίθεση με τη Scala - και τα άρθρα μου) που είναι ειδικά προσαρμοσμένες στη φωνή.

Οι ιστότοποι σίγουρα δεν θα φαίνονται οι ίδιοι και θα προσφέρουν νέα πρότυπα πλοήγησης. Θα πείτε "δείξτε μου προσφορές σε παπούτσια" και αυτό που θα λάβετε πιθανότατα θα είναι καλύτερα οργανωμένο και πιο ευαίσθητο στα συμφραζόμενα από τον μέσο ιστότοπό σας ("προσφορές" && "παπούτσια"). Επιπλέον, δεν θα ήθελα να κάνω κύλιση ή να πω πολύ "επόμενη σελίδα", επομένως οι αλληλεπιδράσεις θα πρέπει να εξατομικευτούν. Το σύστημα πρέπει ήδη να γνωρίζει ότι θέλω ανδρικά παπούτσια και δεν θέλω σκληρά παπούτσια λόγω της τενοντίτιδας του Αχιλλέα μου. Ίσως ξέρει ότι προτιμώ τα σκούρα χρώματα. Ίσως το είπα ή ίσως ανέλυσε τη συμπεριφορά μου.

Είναι καθόλου ιστότοπος; Σίγουρα, αν ψωνίζω παπούτσια, θα ήθελα μια οπτική αναπαράσταση, αλλά αν μιλάω ίσως το μηχάνημα να μιλάει πίσω. Ίσως μου δείχνει παπούτσια και μετά ρωτά: "Ψάχνετε για ένα συγκεκριμένο είδος παπουτσιού; Για ποιο σκοπό είναι αυτά τα παπούτσια; Τα φοράτε πεζοπορία ή σε πάρτι;"

Η εποχή της φωνητικής αναζήτησης θα αλλάξει τα πάντα, από τον τρόπο με τον οποίο αλληλεπιδρούμε με τα μηχανήματα στον τρόπο με τον οποίο κωδικοποιούμε. Πολλές από τις τεχνολογίες που χρειαζόμαστε είναι ήδη διαθέσιμες σήμερα, ενώ άλλες δεν έχουν ακόμη επινοηθεί. Η επίδραση στις διεπαφές χρήστη θα μπορούσε να είναι πιο βαθιά από τη μετάβαση από κάρτες διάτρησης σε πληκτρολόγια.

Αυτή η σαρωτική αλλαγή δεν θα έρθει ταυτόχρονα. Σήμερα δεν είναι η μέρα για να πετάξετε το πληκτρολόγιό σας. Αλλά μπορεί να είναι η μέρα να αρχίσετε να σκέφτεστε τον επανασχεδιασμό του ιστότοπού σας ώστε να είναι πραγματικά προσβάσιμο από τη φωνή.