Pandas-Serie in CSV

Pandas Serie In Csv



Die Methode „Series.to_csv()“ in Pandas gibt das angegebene Serienobjekt in einer kommagetrennten Werte-(csv)-Notation aus. Diese Funktion nimmt einfach die Werte aus einer Reihe und modifiziert ihr Format, indem sie Kommas zur Trennung von Index- und Spaltenwerten hinzufügt.

Um diese Funktion zu verwenden, müssen wir die folgende Syntax verwenden:









Dieser Artikel stellt Ihnen zwei verschiedene Techniken vor, um zu lernen, wie Sie diese Methode in einem Python-Programm einsetzen können.



Beispiel Nr. 1: Verwenden der Methode Series.to_csv() zum Konvertieren einer Serie mit DatetimeIndex in kommagetrennte Werte

Um eine Serie in ein CSV-Format umzuwandeln, verwenden wir die Funktion „Series.to_csv()“. Diese Abbildung generiert eine Reihe mit einem DatetimeIndex und konvertiert sie dann in ein Format mit kommagetrennten Werten.





Um diese Methode in Betrieb zu nehmen, benötigen wir ein Tool, das die Python-Programmierung unterstützt. Für die Zusammenstellung der Codes wird das Tool „Spyder“ gewählt. Um das Skript darauf zu schreiben, haben wir zuerst das installierte Tool in unserem System gestartet. Das Python-Programm benötigt eine Bibliothek, um seine Methoden zum Erreichen des erforderlichen Ergebnisses anzuwenden. Die Bibliothek, die wir hier geladen haben, ist die „Pandas“. In derselben Codezeile wird der Alias ​​dieser Bibliothek als „pd“ identifiziert. Wir müssen also überall im Programm „Pandas“ schreiben, um auf eine Funktion zuzugreifen. Wir würden stattdessen „pd“ schreiben.

Der erste Schritt, um mit dem Code zu beginnen, besteht darin, eine Pandas-Serie zu generieren. Wir müssen „pd“ schreiben, um die Serienerstellungsmethode von Pandas anzuwenden. Die Funktion „pd.Series()“ wird aufgerufen, um eine Reihe mit den angegebenen Werten zu konstruieren. Die Werte, die wir für die Reihe bereitgestellt haben, sind „Istanbul“, „Izmir“, „Ankara“, „Ankara“, „Antalya“, „Konya“ und „Bursa“. Wenn Sie diesem Array von Werten einen Namen geben möchten, können Sie dies tun, indem Sie den Parameter „name“ verwenden. Hier haben wir dieses Array von Werten „Städte“ genannt, da es die Namen von 6 Städten enthält. Um diese Serie zu speichern, wurde ein Serienobjekt „Türkei“ erstellt.



Um einen DatetimeIndex zu erstellen, haben wir die Methode „pd.date_range()“ aufgerufen. Zwischen den Klammern dieser Funktion haben wir 4 Argumente übergeben: „start“, „freq“, „periods“ und „tz“.

Das „Start“-Argument nimmt ein Datum und eine Uhrzeit an, um daraus einen Datumsbereich zu generieren. Hier haben wir das Startdatum und die Startzeit als „2022-03-02 02:30“ angegeben. Der Parameter „Häufigkeit“ klassifiziert die Häufigkeit für den Datumsbereich. Also haben wir es mit dem Wert „D“ versehen. Jetzt wird ein Datumsbereich mit täglicher Häufigkeit erstellt. Das Argument „Zeitraum“ ist auf „6“ gesetzt, was bedeutet, dass ein Datumsbereich für 6 Tage generiert wird. Der letzte Parameter ist „tz“, der die Zeitzone für das angegebene Gebiet angibt. Als Zeitzone haben wir „Asia/Istanbul“ angegeben.

Um diesen Datumsbereich zu speichern, haben wir eine Variable „Datetime“-Variable erstellt. Um den DatetimeIndex festzulegen, haben wir die Eigenschaft „Series.index“ verwendet. Der Serienname „Türkei“ wird mit der Eigenschaft „.index“ versorgt und dem in der Variable „Datetime“ hinterlegten Datumszeitbereich zugeordnet. Daher nimmt die Eigenschaft „index“ die Werte aus der Variable „Datetime“ und macht sie zur Indexliste der Serie „Turkey“. Um schließlich die Ausgabeserie anzuzeigen, haben wir die Methode „print()“ verwendet und die Serie „Turkey“ als Eingabe an sie übergeben, um ihren Inhalt anzuzeigen.

Wir haben gerade die Option „Datei ausführen“ gedrückt, um das Skript auszuführen. Folglich können wir eine Reihe mit dem DatetimeIndex sehen, die bei „2022-03-02 02:30:00+03:00“ beginnt und bei „2022-03-07 02:30:00+03:00“ endet, wodurch ein Zeitraum entsteht von 6 Tagen. Unterhalb der Reihe wird auch das „Freq :D“, der Name der Array-Liste „Cities“ und der dtype „object“ genannt.

Jetzt werden wir lernen, diese Serie, die wir gerade im obigen Schnappschuss gesehen haben, in ein CSV-Format zu konvertieren. Um die Serie in durch Kommas getrennte Werte zu ändern, haben wir eine Methode, die vom pandas-Modul bereitgestellt wird, nämlich „Series.to_csv()“. Diese Methode nimmt die Werte der bereitgestellten Reihen und fügt Kommas zwischen den Werten der Spalte hinzu.

Die Funktion „Series.to_csv()“ wird aufgerufen. Der Name der Serie, die wir konvertieren möchten, wird mit der Methode als „Turkey.to_csv()“ angegeben. Um die durch Kommas getrennten Werte beizubehalten, haben wir eine Variable „Comma_Separated“ erstellt und ihren Inhalt dann durch Aufrufen der Funktion „print()“ in das Ausgabefenster eingefügt.

Hier ist unsere Serie im csv-Format. Wir können in der Momentaufnahme sehen, dass der Index und die Reihenwerte durch die darin enthaltenen Kommas getrennt wurden.

Beispiel Nr. 2: Verwenden der Methode Series.to_csv() zum Konvertieren einer Reihe mit NaN-Werten in kommagetrennte Werte

Die zweite Methode zum Ausführen der „Series.to_csv()“-Methode besteht darin, diese Methode anzuwenden, um eine Serie, die einige Nulleinträge enthält, in ein CSV-Format zu konvertieren.

Wir haben zunächst die notwendigen Pakete eingespielt. Das „pd“ wird zum Alias ​​für Pandas und „np“ zum Alias ​​für numpy. Das numpy-Toolkit wird hier geladen, weil wir mit „np.NaN“ einige Nulleinträge in unsere Serie machen werden, während wir sie mit der pandas-Methode „pd.Series()“ erstellen.

Die Funktion „pd.Series()“ wird zum Erstellen einer Pandas-Serie mit diesen Werten aufgerufen: „Nile“, „Amazon“, np.NaN, „Ganges“, „Mississippi“, „np.NaN“, „Yangtze“, „Donau“, „Mekong“, „np.NaN“ und „Wolga“. Es sind insgesamt 21 Werte für die Reihe definiert, von denen 3 Einträge „np.NaN“-Werte enthalten, was bedeutet, dass 3 Werte in der Reihe fehlen. Die Eigenschaft „name“ gibt den Namen für dieses Array von Werten an, das wir mit „Titles“ bereitgestellt haben. Die Eigenschaft „index“ wird verwendet, um die benutzerdefinierte Indexliste festzulegen, anstatt die Standardliste zu verwenden.

Hier wollen wir die Indexliste mit den Werten „10“, „11“, „12“, „13“, „14“, „16“, „17“, „18“, „19“, „20“, und 21'. Jetzt wird unsere Serie die Indexliste beginnend mit „10“ anstelle von „0“ haben. Speichern Sie nun diese Serie, damit wir sie später im Programm verwenden können. Wir haben ein Serienobjekt „Rivers“ initialisiert und weisen ihm die Ausgabeserie zu, die durch den Aufruf der Methode „pd.Series()“ generiert wird. Die Serie kann angezeigt werden, indem sie mit der Funktion „print()“ von Python angezeigt wird.

Die gerenderte Ausgabe auf dem Terminal druckte eine Reihe, deren Indexliste bei 10 beginnt und bei 21 endet, was bedeutet, dass die Reihe 21 Werte hat.

Die Serie wird mit der Methode „Series.to_csv()“ in ein CSV-Format umgewandelt.

Wir haben bei unserer Serie „Türkei“ die Methode „Series.to_csv()“ aufgerufen. Daher nimmt diese Methode die Werte aus der „Türkei“-Reihe und konvertiert sie in ein kommagetrenntes Werteformat. Das Ergebnis wird in der Variable „Converted_csv“ gespeichert. Und schließlich wird die konvertierte Serie mit Hilfe der Funktion „print()“ ausgedruckt.

In der Momentaufnahme des Ergebnisses unten können Sie sehen, dass die Werte der Reihe jetzt so geändert werden, dass ein Komma verwendet wird, um sie von der Indexliste zu trennen. Außerdem wird bei fehlenden Werten nur die Indexnummer mit Komma gedruckt.

Fazit

Die Modifikation einer Pandas-Serie in ein CSV-Format ist ein praktischer Ansatz. Dies kann mit der pandas-Funktion „Series.to_csv()“ erreicht werden. Dieser Leitfaden hat zwei Techniken zur Anwendung dieser Methode in die Praxis umgesetzt. In der ersten Abbildung haben wir diese Methode aufgerufen, um eine Reihe mit einem DatetimeIndex in ein Format mit kommagetrennten Werten zu konvertieren. Die zweite Instanz hat die Funktion 'Series.to_csv()' verwendet, um eine Serie mit einigen fehlenden Einträgen in ein CSV-Format zu ändern. Beide Techniken wurden praktisch mit dem Tool „Spyder“ auf dem Windows-Betriebssystem implementiert.