Pandas neu indizieren

Pandas Neu Indizieren



„In „Pandas“ können wir viele Informationen in tabellarischer Form speichern, die auch als DataFrame bekannt ist. Die „Pandas“ erleichtern uns mit der Methode „DataFrame()“ den Aufbau des DataFrames. Der DataFrame enthält Indizes, und wir können die Indizes des DataFrame auch ändern, indem wir die „Pandas“-Funktionen verwenden. Die Methode, die wir zum Neuindizieren des DataFrame verwenden, ist die Methode „reindex()“. Diese Methode hilft beim Ändern der Indexwerte der Zeile sowie der Indexwerte der Spalten. Durch die Verwendung dieser Methode können wir den Standardindex des DataFrame ändern, und wir können auch den Index ändern, den wir beim Erstellen des DataFrame festgelegt haben. Wir werden die „reindex()“-Methode in unseren „Pandas“-Beispielen in diesem Tutorial verwenden und dieses Konzept hier ausführlich erläutern.“

Beispiel Nr. 01

Das „Spyder“-Tool hilft uns bei der Entwicklung des „Pandas“-Codes hier in diesem Tutorial, und wir beginnen unseren Code mit dem Schlüsselwort „import“, das beim Importieren der „Pandas“-Funktion hilft. Wir platzieren „pandas as pd“, nachdem wir „import“ eingegeben haben. Danach erstellen wir den DataFrame, indem wir „pd.DataFrame()“ eingeben. Wir schreiben dieses „pd“ hier, weil „DataFrame()“ die Methode von „pandas“ ist. Der „value_df“ ist der Name der Variable, in der der DataFrame gespeichert wird. Wir fügen „RandomName“ hinzu, das ist der Spaltenname, und „RandomName“ enthält „Thomas, Oscar, Lilly, Rowan, John, Bromley, Peter, Alexander und Samuel“.







Dann haben wir „Value_1“, in das wir „16, 29, 24, 35, 44, 50, 69, 74 und 88“ eingefügt haben. Dann kommt „Wert_2“, und wir haben „25, 38, 42, 56, 54, 65, 78, 89 und 99“ hinzugefügt. Jetzt kommt „Value_3“ als nächstes und wir platzieren „36, 48, 52, 69, 74, 75, 87, 91 und 69“ darin. Danach ist die Spalte „Wert_4“ vorhanden, in der wir „52, 64, 72, 88, 82, 95, 97, 21 und 39“ eingefügt haben. Die letzte Spalte ist hier die Spalte „Wert_5“, und in dieser Spalte haben wir die Werte „66, 78, 82, 99, 34, 45, 57, 61 und 89“ hinzugefügt. Danach verwenden wir die Funktion „print()“, in der „Values_df“ hinzugefügt wird. Es wird auf dem Terminal gedruckt.




Nachdem wir „Shift+Enter“ gedrückt haben, können wir das Ergebnis unserer Codes ganz einfach in der „Spyder“-App abrufen. Hier gibt dieser Code den DataFrame mit dem Standardindex zurück. Jetzt wenden wir die Methode „reindex()“ an, um diesen DataFrame in „Pandas“ neu zu indizieren.




Die Funktion „reindex()“ wird hier verwendet, um den Indexwert der Zeile neu zu indizieren. Im obigen DataFrame können Sie sehen, dass die Standardindexwerte der Zeile angezeigt werden, und jetzt wenden wir die Methode „reindex()“ an, um diese Zeilenindizes neu zu indizieren. Wir platzieren den Namen des DataFrames und dann die Methode „reindex()“, in der wir die Indexwerte platzieren, die wir dem obigen DataFrame hinzufügen möchten. Wir setzen „ind_A, ind_B, ind_C, ind_D, ind_E, ind_F, ind_G, ind_H und ind_I“ in die Funktion „reindex()“. Die Indizes dieser Zeilen werden also im DataFrame aktualisiert, wenn wir diesen Code ausführen.






Die Werte des Index der Zeile werden in diesem Ergebnis angezeigt, und Sie können feststellen, dass die DataFrame-Werte hier nicht angezeigt werden und die „NaN“-Werte erschienen sind. Dies liegt daran, dass die neuen Indexwerte nicht mit den vorherigen Indexwerten des DataFrame übereinstimmen. Wenn der neue Index und der alte Index nicht übereinstimmen, wird dort „Nan“ angezeigt. Diese „NaN“-Werte werden standardmäßig angezeigt, wenn wir den Index ändern, und sie stimmen nicht mit dem vorherigen Index überein.



Beispiel Nr. 02

Wir ändern jetzt die Spaltenindexwerte von „Value_df“, die wir zuvor in Beispiel 1 erstellt haben. Nach dem Drucken von „Value_df“ setzen wir die Variable „column“ und fügen ihr einige Werte hinzu. Wir fügen „a_1, b_1, c_1, d_1 und e_1“ hinzu. Diese Werte wollen wir nun als Index der Spalten anpassen, dazu verwenden wir die Methode „reindex()“ und platzieren den Namen der Variable „column“, in der die neuen Spaltenindexwerte gespeichert werden Setzen Sie auch die „Achse“ auf „Spalten“, damit der Spaltenachsenindex aktualisiert wird. Wir fügen die Methode „reindex()“ in „print()“ ein, damit sie auch auf dem Terminal gerendert wird.


Da wir die „reindex()“-Methode verwendet haben, werden die Spaltenindexwerte, die im ersten DataFrame vorhanden sind, aktualisiert, und neue Werte werden im aktualisierten DataFrame hinzugefügt. Sie können auch beachten, dass alle Werte des DataFrames in „NaN“ konvertiert werden, da beide Indexwerte der Spalten unterschiedlich sind.

Beispiel Nr. 03

Die „Programming_data“ in diesem Code enthalten „P_Languages“, wo wir „JavaScript, CSS, Web Engineering, OOP, C#, AI, Java und JavaScript“ hinzugefügt haben. Dann haben wir „Stunden“, in denen wir „4_hrs, 2_hrs, 3_hrs, 7_hrs, 6_hrs, 5_hrs, 8_hrs und 6_hrs“ platzieren. Danach wird der „P_Code“ eingegeben und wir fügen „11523, 12423, 12321, 11456, 11454, 12267, 13106 und 14123“ ein. Wir fügen die Variable „p_index“ hinzu und setzen „Pro_A, Pro_B, Pro_C, Pro_D, Pro_E, Pro_F, Pro_G und Pro_H“.

Diese Werte werden als Indexwerte der Zeilen verwendet. Wir ändern die „Programming_data“ im „Programming_df“ DataFrame. Wir fügen diesem DataFrame auch den „p_index“ hinzu, indem wir die Methode „index“ verwenden. Wir setzen „Programming_df“ und dann die Methode „index“ und weisen dieser den „p_index“ zu. Jetzt werden die obigen Indexwerte als Zeilenindexwerte zum DataFrame hinzugefügt. Wir drucken auch das „Programming_df“.

Danach fügen wir einige neue Indexwerte in der Variablen „new_index“ hinzu, und dies sind „P_1, P_2, P_3, P_4, P_5, P_6, P_7 und P_8“. Da wir die Indexwerte von Zeilen aktualisieren möchten, verwenden wir die Methode „reindex()“ und setzen „new_index“ als Parameter dieser Funktion und speichern auch den aktualisierten DataFrame in „newProgramming_df“ und platzieren „newProgramming_df“ in „ print()“ zum Anzeigen.


Die Indexwerte werden aktualisiert, und wir können auch sagen, dass wir den von uns erstellten DataFrame neu indiziert haben. Alle Werte des DataFrames werden ebenfalls in „NaN“ konvertiert, da beide Indexwerte unterschiedlich sind.

Beispiel Nr. 04

Wir ändern derzeit die Indexwerte von „Programming_df“ von Spalten, die wir zuvor in Beispiel 3 entwickelt haben. Wir platzieren die Variable „Spalte“ und fügen neue Werte in sie ein. Die Variablen „Spalte“, „P_Code“, „P_Sprachen“, „Stunden“ und „Neu“ werden hinzugefügt. Dann verwenden wir erneut die Methode „reindex()“, in der wir die Variable „column“ setzen, die die vorherigen Spaltenindexwerte aktualisiert und diese neuen Spaltenindexwerte zum DataFrame hinzufügt.

Hier können Sie feststellen, dass die neuen Werte, die wir in „Spalte“ hinzugefügt haben, dieselben sind, die wir im obigen DataFrame hinzugefügt haben, aber die Reihenfolge ist anders, sodass die Reihenfolge der Spalten geändert und alle Spalten wie wir angepasst werden in der Variable „Spalte“ erwähnt. Außerdem fügen wir einen weiteren Indexwert hinzu, der im obigen DataFrame nicht vorhanden ist, der hier „Neu“ ist, sodass die „NaN“-Werte in dieser Spalte erscheinen.


Die Reihenfolge der Spalten wird hier geändert, und alle Werte erscheinen so, wie sie in den Spalten des ursprünglichen DataFrame vorhanden sind, und die Spalte „Neu“ im aktualisierten DataFrame enthält alle „NaN“-Werte, da diese Spalte im ursprünglichen DataFrame nicht vorhanden ist.

Fazit

Wir haben dieses Tutorial vorgestellt, das uns hilft, den Begriff „Pandas Reindex“ im Detail zu verstehen. Wir haben besprochen, wie wir die Spalte eines DataFrames sowie die Indexwerte der Zeile neu indizieren können. Wir haben erklärt, dass dafür die Funktion „reindex()“ von „pandas“ verwendet wird. Wir haben verschiedene Beispiele gemacht, in denen wir die Indexwerte der Zeilen des DataFrame und auch die Indexwerte des Spaltenindex des DataFrame geändert haben. Wir haben die Ergebnisse aller Codes, die wir hier in diesem Tutorial erstellt haben, gerendert und auch ausführlich erklärt.