Προγραμματισμός

Watson wannabes: 4 έργα ανοιχτού κώδικα για τη νοημοσύνη μηχανών

Τον περασμένο χρόνο, ως μέρος των νέων εταιρικών υπηρεσιών που η IBM προωθούσε την ανακάλυψή της, ο Watson έχει γίνει λιγότερο από ένα "Jeopardy" - κερδίζοντας τέχνασμα και περισσότερο από ένα εργαλείο. Παραμένει επίσης η ιδιόκτητη δημιουργία της IBM.

Ποιες είναι λοιπόν οι πιθανότητες δημιουργίας ενός συστήματος μηχανικής εκμάθησης φυσικής γλώσσας σύμφωνα με το Watson, αν και με στοιχεία ανοιχτού κώδικα; Σε κάποιο βαθμό, αυτό έχει ήδη συμβεί - εν μέρει επειδή το ίδιο το Watson χτίστηκε πάνω από την υπάρχουσα εργασία ανοιχτού κώδικα και άλλοι έχουν αναπτύξει παρόμοια συστήματα παράλληλα με το Watson. Ακολουθεί μια ματιά σε τέσσερα τέτοια έργα.

DARPA DeepDive

Η μεγαλύτερη επωνυμία της δέσμης, το έργο DeepDive του DARPA δεν προορίζεται να μιμηθεί το σύστημα ερωτήσεων απλής γλώσσας του Watson, αλλά μάλλον την ικανότητα του Watson να βελτιώσει τη λήψη αποφάσεών του με την πάροδο του χρόνου με ανθρώπινη καθοδήγηση.

Αναπτύχθηκε κυρίως από τον Christopher Re, καθηγητή στο Πανεπιστήμιο του Ουισκόνσιν, το έργο είναι ανοιχτού κώδικα (Apache 2.0). Σύμφωνα με την EE Times, ο κύριος στόχος του DeepDive είναι να δημιουργήσει ένα αυτοματοποιημένο σύστημα για την ταξινόμηση των μη δομημένων δεδομένων - σε μία περίπτωση περίπτωση, κατηγοριοποίηση άρθρων σε τεχνικά περιοδικά. Όσοι σχεδιάζουν να κάνουν χρήση του DeepDive θα πρέπει να είναι εξοικειωμένοι με το SQL και το Python, αλλά το σύστημα είναι ήδη σε θέση να εξαγάγει δεδομένα από μια μεγάλη ποικιλία συμβατικών πηγών, όπως ιστοσελίδες ή έγγραφα PDF.

Apache UIMA

Η μη δομημένη διαχείριση πληροφοριών (UIMA) είναι ένα πρότυπο για την εκτέλεση ανάλυσης σε περιεχόμενο κειμένου. Ο Watson χρησιμοποίησε μια εφαρμογή του UIMA, αλλά δεν χρειάζεται να περάσετε από το Watson για να χρησιμοποιήσετε το UIMA. Στην πραγματικότητα, η αρχιτεκτονική UIMA της IBM ήταν ανοιχτού κώδικα και διατηρείται από το Ίδρυμα Apache. Διαθέτει υποστήριξη για πολλές γλώσσες προγραμματισμού, με τις ενημερώσεις να προστίθενται περιοδικά (πιο πρόσφατα τον Οκτώβριο του 2014).

Το Apache UIMA ως έχει είναι πολύ μακριά από το να είναι μια πλήρης λύση μηχανικής μάθησης. είναι μόνο ένα - αν και σημαντικό - μέρος του συνόλου που δημιούργησε η IBM. Εάν δεν θέλετε να χρησιμοποιήσετε τα γυμνά οστά, μπορείτε να παραλάβετε ένα από τα παράγωγα έργα του, όπως το YodaQA, το οποίο αξιοποιεί το UIMA για την επεξεργασία του και χρησιμοποιεί τη Wikipedia ως κύρια πηγή δεδομένων.

OpenCog

Το OpenCog "στοχεύει να παρέχει σε επιστήμονες της έρευνας και προγραμματιστές λογισμικού μια κοινή πλατφόρμα για τη δημιουργία και κοινή χρήση προγραμμάτων τεχνητής νοημοσύνης." Ανοιχτή πηγή βάσει της άδειας GNU Affero, η φιλοδοξία του έργου είναι να τροφοδοτήσει τίποτα λιγότερο από αυτό που οι δημιουργοί αποκαλούν «γενικά ευφυή» συστήματα, τεχνητή νοημοσύνη που έχει ευρείες, ανθρωπιστικές αντιλήψεις για τον κόσμο αντί για επικεντρωμένες στον τομέα ειδικότητες (όπως είναι πολύ καλός στο σκάκι αλλά τίποτα άλλο).

Οι δημιουργοί του OpenCog ισχυρίζονται ότι το πλαίσιο τους χρησιμοποιείται ήδη σε "εφαρμογές φυσικής γλώσσας, τόσο για έρευνα όσο και από εμπορικές εταιρείες". Αυτό το βάζει λίγο πιο μακριά από τις έννοιες AI της πίτας στον ουρανό και πιο κοντά στον πρακτικό τομέα Q&A που κατοικεί ο Watson.

OAQA (Ανοικτή πρόοδος των συστημάτων απάντησης ερωτήσεων)

Όπως μπορεί να υποδηλώνει το όνομα, η αποστολή της OAQA είναι "ανοιχτή πρόοδος στη μηχανική των συστημάτων απάντησης - γλωσσικών συστημάτων λογισμικού που παρέχουν άμεσες απαντήσεις σε ερωτήσεις που τίθενται στη φυσική γλώσσα." Ακούγεται σαν ένας από τους στόχους του Watson; Ναι, ειδικά αφού το OAQA ξεκίνησε από κοινού από την IBM και το Πανεπιστήμιο Carnegie Mellon. Όπως το Apache UIMA, το OAQA εφαρμόζει το πλαίσιο UIMA, αλλά μην το θεωρείτε ως μια έτοιμη προς χρήση λύση. είναι μια εργαλειοθήκη.

Το ένα σημαντικό μειονέκτημα σε κάθε έργο, όπως μπορείτε να μαντέψετε, είναι ότι δεν προσφέρονται σε τόσο εξευγενισμένο ή στιλβωμένο πακέτο όπως το Watson. Ενώ το Watson έχει σχεδιαστεί για άμεση χρήση σε επιχειρηματικό πλαίσιο, αυτά είναι ακατέργαστα εργαλεία που απαιτούν βαριά ανύψωση.

Επιπλέον, οι υπηρεσίες του Watson έχουν ήδη προ-εκπαιδευτεί με ένα επιμελημένο σύνολο δεδομένων πραγματικού κόσμου. Με αυτά τα συστήματα, θα πρέπει να παρέχετε τις πηγές δεδομένων, οι οποίες μπορεί να αποδειχθούν ότι είναι πολύ μεγαλύτερο έργο από τον ίδιο τον προγραμματισμό.

$config[zx-auto] not found$config[zx-overlay] not found