Semantische Versionerung und neue Features für pandas

Python-Bibliothek pandas auf dem Weg zu v1.0.0: Erster Release Candidate erschienen
Keine Kommentare

Die beliebte Data-Science-Bibliothek pandas hat gerade erst ihren zwölften Geburtstag gefeiert, und nun steht Version 1.0.0 in den Startlöchern. Der erste Release Candidate gibt Einblicke in einen neuen Skalar für fehlende Werte, einen neuen Umgang mit veralteten Funktionen gemäß semantischer Versionierung, eine Überarbeitung der Webseite und mehr.

Der erste Release Candidate für pandas 1.0.0 ist erschienen. Die anstehende Major-Version mit geplantem Release-Datum in zwei Wochen wird neue Features und eine Änderung im Umgang mit Updates enthalten.

Beginnend mit v1.0.0 wird die Python-Bibliothek einer Variante der semantischen Versionierung folgen (Major.Minor.Patch). Das bedeutet, dass Deprecations und Breaking Changes für APIs nur in Major-Versionen umgesetzt werden, mit Ausnahme experimenteller API-Änderungen. Der Support für spezifische Python-Versionen wird ebenfalls nur in Major-Versionen auslaufen.

pandas, abgeleitet von „panel data“, ist eine Open-Source-Bibliothek für Python. Sie dient der Datenanalyse und -Manipulation und wird vorrangig für Machine Learning eingesetzt. Die initiale Veröffentlichung fand am 11. Januar 2008 statt. Aktuell befindet sich pandas in der stabilen Version 0.25.3.

Die Features in pandas 1.0.0 rc0

Der erste RC für Version 1.0.0 bringt einen experimentellen Skalar für fehlende Werte mit: Der neue pd.NA-Wert soll über die verschiedenen Datentypen hinweg verwendet werden können.

Bisher repräsentierte zum Beispiel np.nan fehlende Float-Werte, während np.nan oder None fehlende object-dtype-Werte bezeichneten. Weitere fehlende Werte erhielten unter anderem die Zuweisung pd.NaT. Das neue Feature ist noch als experimentell gekennzeichnet, weshalb pd.NA unvorhergesehenes Verhalten an den Tag legen kann.

Ein weiteres experimentelles Feature ist StringDtype. Dieser Extension-Typ für String-Daten soll einige Schwierigkeiten mit object-dtype-NumPy-Arrays beheben. Unter anderem soll dadurch das versehentliche Speichern einer Mischung aus Strings und Nicht-Strings verhindert werden.

Zu den weiteren angekündigten Neuerungen zählen eine Überarbeitung der Webseite und des Documentation Themes.

Installation des Release Candidate

Da viele ältere Deprecations entfernt wurden, empfehlen die pandas-Entwickler, zunächst auf pandas 0.25 zu aktualisieren, um Kompatibilitätsschwierigkeiten auszuschließen. Zudem wurde für pandas 1.0.0 die Mindestanforderung der Sprachversion auf Python 3.6.1 erhöht.

pandas 1.0.0rc0 kann via PyPI python -m pip install --upgrade --pre pandas==1.0.0rc0 oder conda-forge conda install -c conda-forge/label/rc pandas==1.0.0rc0 installiert werden.

Weitere Informationen bieten die offizielle Webseite sowie das GitHub Repository.

Unsere Redaktion empfiehlt:

Relevante Beiträge

Abonnieren
Benachrichtige mich bei
guest
0 Comments
Inline Feedbacks
View all comments
X
- Gib Deinen Standort ein -
- or -