Προγραμματισμός

3 Kaggle εναλλακτικές λύσεις για τη συλλογική επιστήμη δεδομένων

Ποιος είναι ο καλύτερος τρόπος για να πάρετε μια καλή απάντηση σε μια δύσκολη ερώτηση; Ρωτήστε ένα σωρό άτομα και κάντε έναν διαγωνισμό. Ήταν εδώ και πολύ καιρό η προσέγγιση του Kaggle στην επιστήμη των δεδομένων: Μετατρέψτε τις δύσκολες αποστολές, όπως η ακριβέστερη ανίχνευση καρκίνου του πνεύμονα, σε διαγωνισμούς πληρωμών γενναιοδωρίας, όπου κερδίζουν οι καλύτερες ομάδες και οι καλύτεροι αλγόριθμοι.

Τώρα η Kaggle κυκλοφορεί στο Google και ενώ όλα τα σημάδια δείχνουν ότι διατηρούνται όπως είναι προς το παρόν, θα υπάρξουν ανησυχίες για τις μακροπρόθεσμες προοπτικές για έναν ιστότοπο με μια τόσο αφοσιωμένη κοινότητα και μια ιδιοσυγκρασιακή προσέγγιση.

Ακολουθούν τρεις άλλοι ιστότοποι που μοιράζονται μια παρόμοια αποστολή, εάν δεν ακολουθούνται ρητά στα βήματα του Kaggle. (Σημειώστε ότι ορισμένοι ιστότοποι, όπως το CrowdAnalytix, ενδέχεται να θεωρήσουν αποδεκτές λύσεις σε διαγωνισμούς ως έργα προς ενοικίαση και ως εκ τούτου την ιδιοκτησία τους.)

CrowdAI

Ένα προϊόν της École Polytechnique Fédérale de Lausanne στην Ελβετία, το CrowdAI είναι μια πλατφόρμα ανοιχτού κώδικα για τη φιλοξενία ανοιχτών προκλήσεων δεδομένων και για να μάθει πώς λύθηκαν τα εν λόγω προβλήματα. Η πλατφόρμα είναι αρκετά νέα, με έως τώρα έξι προκλήσεις που προσφέρονται, αλλά τα σεμινάρια που προέρχονται από αυτές τις προκλήσεις είναι λεπτομερή και πολύτιμα, παρέχοντας βήμα προς βήμα μεθοδολογίες για την αναπαραγωγή αυτής της εργασίας ή τη δημιουργία κάτι παρόμοιο. Οι υπάρχουσες ασκήσεις καλύπτουν κοινά πλαίσια όπως το Torch ή το TensorFlow, οπότε είναι ένα καλό μέρος για να αποκτήσετε πρακτικές λεπτομέρειες για τη χρήση τους.

DrivenData

Το DrivenData, που δημιουργήθηκε από μια εταιρεία συμβούλων που ασχολείται με επαγγελματικά προβλήματα δεδομένων, φιλοξενεί διαδικτυακές προκλήσεις που διαρκούν μερικούς μήνες. Ο καθένας επικεντρώνεται ειδικά στα πιεστικά προβλήματα που αντιμετωπίζει ο κόσμος γενικά, όπως η πρόβλεψη της εξάπλωσης ασθενειών ή η εξόρυξη δεδομένων Yelp για τη βελτίωση των διαδικασιών επιθεώρησης εστιατορίων. Όπως το Kaggle, το DrivenData διαθέτει επίσης έναν πίνακα εργασιών για την επιστήμη δεδομένων - ένα χαρακτηριστικό που οι άνθρωποι ανησυχούν ότι ενδέχεται να λείπουν από την Kaggle μετά την απόκτηση.

CrowdAnalytix

Με την υποστήριξη επενδυτών από τους Accel Partners και SAIF Partners, το CrowdAnalytix επικεντρώνεται στη διοργάνωση διαγωνισμών επίλυσης προβλημάτων που βασίζονται σε δεδομένα, παρά στην ανταλλαγή πληροφοριών που προκύπτουν από αυτούς. Προσφέρονται διαγωνισμοί για την εξεύρεση λύσεων σε προβλήματα σε κατηγορίες όπως μοντελοποίηση, οπτικοποίηση και έρευνα, και ο καθένας έχει χάρη σε χιλιάδες δολάρια. Ορισμένες προηγούμενες προκλήσεις περιλαμβάνουν την πρόβλεψη του πραγματικού κόστους των αξιώσεων αποζημίωσης των εργαζομένων ή των καθυστερήσεων των αεροπορικών εταιρειών. Άλλοι διαγωνισμοί, ωστόσο, δεν φιλοξενούνται για χρήματα, αλλά για την παροχή ανταγωνιστικής επιλογής για την εκμάθηση σχετικής πειθαρχίας, όπως η γλώσσα R.