Προγραμματισμός

Το Pandas 1.0 φέρνει μεγάλες αλλαγές

Ο Pandas, η βιβλιοθήκη ανάλυσης δεδομένων για την Python, έφτασε επιτέλους σε έναν υποψήφιο έκδοσης 1.0. Το Pandas 1.0 αφαιρεί πολλές καταργημένες λειτουργίες και απαιτεί Python 3.6 ή καλύτερη.

Το Pandas δημιουργήθηκε για εύκολη εργασία με δεδομένα σε δομημένες μορφές, όπως πίνακες, πίνακες και δεδομένα χρονοσειρών. Το Pandas αποκλείει μεγάλο μέρος της λειτουργικότητας των πλαισίων δεδομένων του R. και λειτουργεί καλά με άλλες επιστημονικές βιβλιοθήκες υπολογιστών στον κόσμο της Python.

Με το Pandas 1.0, οι δημιουργοί του Pandas εισάγουν πολλές αλλαγές που έχουν ήδη αρχίσει να δουλεύουν εδώ και αρκετό καιρό. Εδώ είναι μια σειρά από τα πιο σημαντικά και πώς να τα χειριστείτε στο μέλλον.

Το Pandas απαιτεί Python 3.6.1 ή νεότερο

Η μεγαλύτερη αλλαγή στο Pandas 1.0 είναι η πτώση της υποστήριξης για όλες τις εκδόσεις του Python νωρίτερα από το Python 3.6.1. Ο Pandas έχασε την υποστήριξη για το Python 2 και δεσμεύτηκε αποκλειστικά για το Python 3 από το 2019, οπότε αυτό είναι ως επί το πλείστον βελτίωση μιας υπάρχουσας πολιτικής.

Το έργο έχει επίσης μια νέα πολιτική υποστήριξης για μελλοντικές εκδόσεις του Pandas. Οποιαδήποτε πτώση υποστήριξης για μια έκδοση του Python θα κυκλοφορήσει σε μεγάλες νέες εκδόσεις του Pandas (2.0, 3.0 κ.λπ.). Οι μικρές κυκλοφορίες θα καταργήσουν τις δυνατότητες, αλλά δεν θα τις καταργήσουν. Οι σημαντικές εκδόσεις θα καταργήσουν τις δυνατότητες.

Η νέα τιμή NA της Pandas

Οι παλαιότερες εκδόσεις των Pandas χρησιμοποίησαν διαφορετικούς τύπους για την αναπαράσταση δεδομένων που λείπουν, ανάλογα με τον τύπο του κοντέινερ - ένας για τύπους ώρας δεδομένων, ένας για αντικείμενα κ.λπ. Όλα αυτά συγχωνεύονται σε έναν μόνο τύπο δεδομένων που λείπουν που ονομάζεται NA Αυτήν τη στιγμή, η υποστήριξη για το NA περιορίζεται σε μερικούς τύπους αντικειμένων και θεωρείται πειραματική, επομένως δεν πρέπει να χρησιμοποιείται ακόμη στην παραγωγή.

Ασυμβατότητες API

Λόγω του αριθμού των αλλαγών στο Pandas 1.0, ορισμένα από τα API του Pandas είναι πλέον ασύμβατα προς τα πίσω. Αυτό περιλαμβάνει αλλαγές στις συμπεριφορές πολλών κοινών στοιχείων:

  • ο Πλαίσιο δεδομένων τύπος
  • pandas.array
  • συστοιχίες.IntegerArray

Πολλές από αυτές τις ασυμβατότητες θα προκαλέσουν προειδοποιήσεις, αλλά είναι καλύτερο να δοκιμάσετε τα υπάρχοντα σενάρια Pandas δίπλα-δίπλα με τα αντίστοιχα Pandas 1.0 για να δείτε πώς λειτουργούν.

Λειτουργίες που έχουν καταργηθεί στο Pandas 1.0

Η τεκμηρίωση του Pandas παραθέτει όλες τις λειτουργίες που θα καταργηθούν αλλά δεν θα καταργηθούν στο Pandas 1.0. Ορισμένα απλώς έχουν μετονομαστεί ή αναδιοργανωθεί, όπως το δομοστοιχείο δοκιμών, ενώ άλλα αλλάζουν τη χρήση ορισμένων παραμέτρων λειτουργίας. Σε μερικές περιπτώσεις, όπως με Series.item () και Index.item (), οι λειτουργίες έχουν διασωθεί από την κατάργηση και θα συνεχίσουν να είναι διαθέσιμες.

Εάν χρησιμοποιείτε μια έκδοση του Pandas νωρίτερα από 0,25, οι δημιουργοί του Pandas προτείνουν τη μετεγκατάσταση στο Pandas 0.25πρώτα, διασφαλίζοντας ότι όλοι οι κώδικες που εξαρτώνται από την Panda συμπεριφέρονται όπως αναμένεται,έπειτα μετεγκατάσταση στο Pandas 1.0. Αυτό γίνεται για να διασφαλιστεί ότι οποιοσδήποτε κώδικας που χρησιμοποιεί καταργημένη λειτουργικότητα θα επισημανθεί.

Οι λειτουργίες καταργήθηκαν στο Pandas 1.0

Ορισμένες βασικές δυνατότητες Pandas έχουν καταργηθεί εντελώς στο Pandas 1.0:

  • SparseSeries και SparseDataFrame. Χρήση Σειρά ή Πλαίσιο δεδομένων με την ελάχιστες τιμές αντ 'αυτού.
  • Εγγραφή μονάδας Matplotlib. Αυτό γίνεται για να μην επηρεαστεί το Matplotlib κατά την εισαγωγή Pandas.
  • Πολλές άλλες λειτουργίες που είχαν καταργηθεί στο παρελθόν.

Και πάλι, αυτός είναι ένας άλλος λόγος για να δοκιμάσετε τον υποψήφιο κυκλοφορίας του Pandas 1.0 δίπλα-δίπλα με την υπάρχουσα εγκατάσταση του Pandas και να βεβαιωθείτε ότι τα σενάρια σας συμπεριφέρονται όπως προορίζεται.

Εγκατάσταση του Pandas 1.0

Το Pandas 1.0 μπορεί να εγκατασταθεί απευθείας στο Python μέσω του διαχειριστή πακέτων Pip, πληκτρολογώντας εγκατάσταση pipa. Το Pandas 1.0 είναι επίσης διαθέσιμο ως μέρος της διανομής Anaconda Python για επιστημονικούς υπολογιστές.

Σε όλες τις περιπτώσεις, είναι καλύτερο να εγκαταστήσετε το Pandas σε ένα εικονικό περιβάλλον, ειδικά αν θέλετε να εκτελέσετε δοκιμές σεναρίων Pandas 1.0 δίπλα-δίπλα με τα αντίστοιχα προηγούμενα.