Pandas Dataframe Einzigartig

Pandas Dataframe Einzigartig



Die beliebteste Python-Bibliothek, die in der Datenwissenschaft verwendet wird, heißt Pandas. Es bietet Python-Programmierern leistungsstarke, benutzerfreundliche und Datenanalyse-Tools. Sobald Sie die grundlegenden Funktionen und deren Verwendung verstanden haben, ist Pandas ein wirksames Werkzeug zum Ändern von Daten. In „Pandas“ sind die Standardmethoden zum Speichern von Daten in tabellarischer Form die DataFrames. Wir können einige „Pandas“-Methoden verwenden, um die eindeutigen Werte in der DataFrame-Spalte „Pandas“ zu erhalten. Wenn wir eindeutige Werte in den Spalten des DataFrames erhalten müssen und keine Duplizierung von Werten in der DataFrame-Spalte „pandas“ wünschen, können wir die Methoden verwenden, die „pandas“ dafür bereitstellt. Sehen wir uns solche Methoden in diesem Handbuch zusammen mit einigen Beispielen und Ausgaben an, um eindeutige Werte in der Spalte „Pandas“ des DataFrames zu erhalten.

Methoden zum Abrufen eindeutiger Werte in den Spalten von „Pandas“ DataFrame

Wir können zwei Methoden verwenden, um die eindeutigen Werte in den Spalten des DataFrame „Pandas“ zu erhalten. Wir löschen die doppelten Werte und erhalten nur die eindeutigen Werte in den Spalten von DataFrames. Die Methoden, die „Pandas“ für diese Aufgabe bereitstellen, sind:







  • Durch die Verwendung der Methode unique().
  • Durch die Verwendung der Methode drop_dupliactes().

Jetzt werden wir beide Methoden in den „Pandas“-Codes verwenden, um die eindeutigen Werte in den Spalten des „Pandas“-Datenrahmens zu erhalten.



Beispiel Nr. 01

Die „Spyder“-App wird hier zum Generieren dieser „Pandas“-Codes verwendet, um diese Methoden zu nutzen, die uns dabei helfen, die eindeutigen Werte in den Spalten des „Pandas“-Datenrahmens zu erhalten. Wir müssen die „pandas“-Module importieren, die für den „pandas“-Code notwendig sind, bevor wir den DataFrame erstellen. Indem wir den Begriff „import“ verwenden und „pandas as pd“ platzieren, importieren wir diese Module.



Jetzt können wir mit Hilfe von „pd“ schnell die „pandas“-Funktionen oder -Methoden erhalten. Dann fügen wir die „Subject_data“ ein, in die wir „Name“ einfügen, und in „Name“ fügen wir die Namensdaten hinzu, die „Roman, William, Peter, Smith, John, Milli, Thomas und James“ sind. Dann fügen wir die Fachdaten in „Subj“ hinzu, die „Mathematik, Wirtschaft, Naturwissenschaften, Mathematik, Statistik, Statistik, Statistik und Computer“ sind. Anschließend wandeln wir diese „Subject_data“ mithilfe der Methode „pd.DataFrame()“ in den DataFrame „Subject_df“ um. Wir platzieren „Subject_df“ in der „print()“-Methode, damit es auf dem Terminal angezeigt wird.





Jetzt wollen wir die eindeutigen Werte in der Spalte „Subj“ des DataFrame „Pandas“ abrufen. Zu diesem Zweck verwenden wir hier die Methode „unique()“ und fügen den Namen der Spalte und auch den Namen des DataFrames wie unten gezeigt hinzu. Wir fügen diese Methode in „print()“ hinzu, damit das Ergebnis auch auf dem Terminal angezeigt wird.



Jetzt drücken wir „Shift+Enter“, um das Ergebnis dieses Codes zu erhalten, und es wird auf dem Terminal gerendert und auch hier angezeigt, das den DataFrame mit allen Werten enthält. Dies ist der ursprüngliche DataFrame, den wir im Code hinzugefügt haben, und darunter werden die eindeutigen Werte der Spalte „Subj“ angezeigt. Es löscht die doppelten Werte und zeigt die eindeutigen Werte der Spalte „Subj“ des DataFrame an.

Beispiel Nr. 02

Wir erstellen die „Sample_list“, die einige Informationen enthält. Wir fügen „Layla, 21, 28, 31, 14 und 39“ ein, das als erste Spalte erscheint, wenn wir diese Liste in den DataFrame konvertieren. Dann fügen wir „Lusy, 31, 25, 34, 26 und 21“ als zweite Zeile des DataFrame hinzu. Danach haben wir „Peter, 38, 20, 20, 35 und 24“ und „Layla 38, 23, 39 24, 23“, die die dritte und vierte Zeile des DataFrame sein werden. Wir fügen auch drei weitere Daten ein, nämlich „Stella, 21, 24, 24, 28, 31“, „Layla, 33, 32, 26, 30, 25“ und auch „Peter, 21, 21, 31, 21, 29“. .

Jetzt konvertieren wir die „Sample_list“ in „DF_Sample“, das ist der Name des DataFrames hier, indem wir die Funktion „pd.DataFrame()“ einfügen. Außerdem legen wir die Namen der Spalten dieses DataFrame fest und diese Namen sind „Name, Ass_1, Ass_2, Ass_3, Ass_4 und Ass_5“. Dann verwenden wir „print()“, das bei der Anzeige des DataFrame „DF_Sample“ hilft. Jetzt verwenden wir in diesem Beispiel eine andere Methode, um die eindeutigen Werte in der DataFrame-Spalte abzurufen. Diese Methode ist die „drop_duplicates()“-Methode von „pandas“.

In der Methode „drop_duplicates()“ legen wir den Namen der Spalte fest, in der wir die eindeutigen Werte in der Spalte des DataFrame erhalten möchten. Wir erhalten eindeutige Werte der Spalte „Name“, indem wir die doppelten Werte in dieser Spalte mit Hilfe der Methode „drop_duplicates()“ löschen und diese eindeutigen Werte auch hier mit der Funktion „print()“ rendern.

Die duplizierten Namen werden gelöscht und eindeutige Werte werden nach Anwendung der Methode „drop_duplicates()“ gerendert. Sie können feststellen, dass der Name „Layla“ in drei Zellen der Spalte „Name“ erscheint. Aber wenn die Methode „drop_duplicates()“ auf diese Spalte angewendet wird, werden alle doppelten Werte gelöscht und ein „Layla“-Name erscheint auf dem Bildschirm. Nach dem Löschen der doppelten Werte erschien der neue DataFrame, der die eindeutigen Werte in dieser Spalte „Name“ enthält. Auf diese Weise können wir die doppelten Werte löschen und mit Hilfe der Methode „drop_duplicates()“ den eindeutigen Wert in der Spalte des DataFrame erhalten.

Beispiel Nr. 03

Derselbe DataFrame wird erneut verwendet und jetzt wenden wir hier die Methode „unique()“ an. Mit der „unique()“-Methode platzieren wir den Namen der Spalte sowie den Namen des DataFrames, auf den wir diese „unique()“-Methode anwenden möchten, um die eindeutigen Werte zu erhalten. Dadurch werden nur die eindeutigen Werte dieser Spalte gerendert und diese Werte nicht in Form von DataFrame angezeigt.

Hier enthält der DataFrame sieben Werte in der Spalte „Name“, aber wenn wir die Methode „unique()“ auf diese Spalte anwenden, sind nur vier Werte erschienen, und dies sind die eindeutigen Werte dieser Spalte. Es werden keine doppelten Werte gerendert.

Beispiel Nr. 04

Der DataFrame, den wir in diesem Beispiel erstellen, ist „F_G_df“. Wir fügen „My_fruits“ und „my_Vegs“ in diesen DataFrame ein. Die Spalte „Meine_Früchte“ enthält „Apfel, Orange, Apfel, Birne, Litschi, Apfel, Apfel, Birne und Apfel“. Als nächstes haben wir „My_Vegs“, das die Namen der Gemüsesorten „Chili, Bringle, Carrot, Potato, Potato, Carrot, Onion, Garlic und Ginger“ enthält. Dieser DataFrame enthält nur zwei Spalten.

Jetzt erhalten wir die eindeutigen Werte in beiden Spalten mithilfe der Methode „unique()“. Wir erwähnen den Namen des DataFrame. Geben Sie dann den ersten Spaltennamen der Spalte ein. Danach verwenden wir die Methode append(). In diesem Anhang platzieren wir wieder den Namen des DataFrames und den zweiten Spaltennamen und platzieren die Methode „unique()“. Dadurch werden die eindeutigen Werte beider Spalten abgerufen und dann die eindeutigen Werte beider Spalten angehängt und auf dem Bildschirm angezeigt.

Der DataFrame wird zuerst gerendert und enthält alle Werte. Danach wird die Methode „unique()“ angewendet und die eindeutigen Werte beider Spalten werden unten gerendert. In diesem Code erhalten wir die eindeutigen Werte in den mehreren Spalten des DataFrame, indem wir die Methode „unique()“ verwenden.

Fazit

Die vollständige Erklärung zum Abrufen der eindeutigen Werte in der DataFrame-Spalte finden Sie in diesem Handbuch. Wir haben die Methoden „unique()“ und „drop_duplicates()“ besprochen, die uns dabei helfen, die eindeutigen Werte der Spalte des DataFrames zu erhalten. Wir haben untersucht, wie diese Methoden im „Pandas“-Code verwendet werden, indem wir diese Methoden hier in unseren Codes verwenden. Wir haben in diesem Leitfaden verschiedene Beispiele illustriert und Ihnen gezeigt, wie Sie die eindeutigen Werte einer Spalte mithilfe der Methode „unique()“ sowie der Methode „drop_duplicates()“ erhalten. Wir haben auch untersucht, wie Sie die eindeutigen Werte in mehreren Spalten erhalten, indem Sie die Methode „unique()“ in diesem Handbuch verwenden.