Sortieren Sie den DataFrame in R

Sortieren Sie Den Dataframe In R



Das Sortieren der DataFrames in R ist ein entscheidender Vorgang bei der Datenanalyse und -manipulation. Bezeichnenderweise bietet R viel Flexibilität beim Sortieren der Daten basierend auf mehreren Spalten und beim Sortieren in aufsteigender oder absteigender Reihenfolge. In R kann das Sortieren der DataFrames mit verschiedenen Methoden und Funktionen erfolgen. In diesem Artikel gehen wir verschiedene Funktionen durch, die uns dabei helfen, den DataFrame in einer der angegebenen Reihenfolgen zu sortieren.

Beispiel 1: Sortieren des DataFrame mit der Order()-Methode in R

Die Funktion order() in R wird verwendet, um die DataFrames nach einer oder mehreren Spalten zu sortieren. Die Order-Funktion ruft die Indizes der sortierten Zeilen ab, um die Zeilen des DataFrame neu anzuordnen.

emp = Daten. rahmen ( Namen = C ( 'Andy' , 'Markieren' , „Bonnie“ , „Caroline“ , 'John' ) ,

Alter = C ( einundzwanzig , 23 , 29 , 25 , 32 ) ,

Gehalt = C ( 2000 , 1000 , 1500 , 3000 , 2500 ) )

Katze ( ' \N \N Datenrahmen nach Namen in aufsteigender Reihenfolge sortiert \N ' )

sortiert_asc = emp [ mit ( emp , Befehl ( Namen ) ) , ]

drucken ( sortiert_asc )

Hier definieren wir den „emp“-DataFrame mit drei Spalten, die unterschiedliche Werte enthalten. Die Funktion cat() wird eingesetzt, um die Anweisung auszugeben, die angibt, dass der „emp“-DataFrame nach der Spalte „names“ in aufsteigender Reihenfolge sortiert wird. Dazu verwenden wir die Funktion order() in R, die die Indexpositionen der Werte in einem aufsteigend sortierten Vektor zurückgibt. In diesem Fall gibt die Funktion with() an, dass die Spalte „Namen“ sortiert werden soll. Der sortierte DataFrame wird in der Variablen „sorted_asc“ gespeichert, die als Argument in der print()-Funktion übergeben wird, um die sortierten Ergebnisse zu drucken.







Daher werden im Folgenden die sortierten Ergebnisse der Spalte „DataFrame nach „Namen“ in aufsteigender Reihenfolge angezeigt. Um die Sortieroperation in absteigender Reihenfolge zu erhalten, können wir einfach das negative Vorzeichen mit dem Spaltennamen in der vorherigen Funktion order() angeben:





Beispiel 2: Sortieren des DataFrame mithilfe der Order()-Methodenparameter in R

Darüber hinaus verwendet die Funktion order() die abnehmenden Argumente, um den DataFrame zu sortieren. Im folgenden Beispiel geben wir die Funktion order() mit dem Argument an, in aufsteigender oder absteigender Reihenfolge zu sortieren:





df = Daten. rahmen (

Ausweis = C ( 1 , 3 , 4 , 5 , 2 ) ,

Kurs = C ( 'Python' , 'Java' , „C++“ , „MongoDB“ , 'R' ) )

drucken ( „Sortiert in absteigender Reihenfolge nach ID“ )

drucken ( df [ Befehl ( df$id , abnehmend = WAHR ) , ] )

Hier deklarieren wir zunächst die Variable „df“, in der die Funktion data.frame() mit drei verschiedenen Spalten definiert wird. Als nächstes verwenden wir die Funktion print(), mit der wir eine Nachricht drucken, die angibt, dass der DataFrame basierend auf der Spalte „id“ in absteigender Reihenfolge sortiert wird. Danach setzen wir die Funktion print() erneut ein, um den Sortiervorgang durchzuführen und diese Ergebnisse auszudrucken. Innerhalb der Funktion print() rufen wir die Funktion „order“ auf, um den DataFrame „df“ basierend auf der Spalte „course“ zu sortieren. Das Argument „absteigend“ wird auf TRUE gesetzt, um in absteigender Reihenfolge zu sortieren.

In der folgenden Abbildung ist die „id“-Spalte des DataFrame in absteigender Reihenfolge angeordnet:



Um jedoch die Sortierergebnisse in aufsteigender Reihenfolge zu erhalten, müssen wir das abnehmende Argument der Funktion order() auf FALSE setzen, wie im Folgenden gezeigt:

drucken ( „Sortiert in aufsteigender Reihenfolge nach ID“ )

drucken ( df [ Befehl ( df$id , abnehmend = FALSCH ) , ] )

Dort erhalten wir die Ausgabe der Sortieroperation des DataFrame nach der Spalte „id“ in aufsteigender Reihenfolge.

Beispiel 3: Sortieren des DataFrame mit der Arrange()-Methode in R

Darüber hinaus können wir auch die Methode „arrange()“ verwenden, um einen DataFrame nach Spalten zu sortieren. Wir können auch in aufsteigender oder absteigender Reihenfolge sortieren. Der folgende gegebene R-Code verwendet die Funktion „arrange()“:

Bibliothek ( „dplyr“ )

Student = Daten. rahmen (

Ausweis = C ( 3 , 5 , 2 , 4 , 1 ) ,

Markierungen = C ( 70 , 90 , 75 , 88 , 92 ) )

drucken ( „Erhöhung der Sortierung nach ID“ )

drucken ( arrangieren ( Student , Ausweis ) )

Hier laden wir das Paket „dplyr“ von R, um auf die Methode „arrange()“ zum Sortieren zuzugreifen. Dann haben wir die Funktion data.frame(), die zwei Spalten enthält und den DataFrame in die Variable „student“ setzt. Als nächstes stellen wir die Funktion „arrang()“ aus dem Paket „dplyr“ in der Funktion „print()“ bereit, um den angegebenen DataFrame zu sortieren. Die Funktion „arrang()“ verwendet den DataFrame „student“ als erstes Argument, gefolgt von der „ID“ der Spalten, nach denen sortiert werden soll. Die Funktion print() gibt am Ende den sortierten DataFrame auf der Konsole aus.

In der folgenden Ausgabe können wir sehen, wo die Spalte „ID“ in einer Reihenfolge sortiert ist:

Beispiel 4: Sortieren des DataFrame nach Datum in R

Der DataFrame in R kann auch nach Datumswerten sortiert werden. Hierzu muss die Sortierfunktion mit der Funktion as.date() angegeben werden, um die Datumsangaben zu formatieren.

Veranstaltungsdatum = Daten. rahmen ( Fall = C ( '04.03.2023' , '02.02.2023' ,

'01.10.2023' , '29.03.2023' ) ,

Gebühren = C ( 3100 , 2200 , 1000 , 2900 ) )

Veranstaltungsdatum [ Befehl ( als . Datum ( event_date$event , Format = „%d/%m/%Y“ ) ) , ]

Hier haben wir einen DataFrame „event_date“, der die Spalte „event“ mit den Datumszeichenfolgen im Format „Monat/Tag/Jahr“ enthält. Wir müssen diese Datumszeichenfolgen in aufsteigender Reihenfolge sortieren. Wir verwenden die Funktion order(), die den DataFrame nach der Spalte „Ereignis“ in aufsteigender Reihenfolge sortiert. Dies erreichen wir, indem wir die Datumszeichenfolgen in der Spalte „Ereignis“ mit der Funktion „as.Date“ in die tatsächlichen Daten konvertieren und das Format der Datumszeichenfolgen mithilfe des Parameters „format“ angeben.

Somit stellen wir die Daten dar, die nach der Datumsspalte „Ereignis“ in aufsteigender Reihenfolge sortiert sind.

Beispiel 5: Sortieren des DataFrame mit der Setorder()-Methode in R

Ebenso ist setorder() eine weitere Methode zum Sortieren des DataFrame. Es sortiert den DataFrame, indem es das Argument übernimmt, genau wie die Methode „arrange()“. Der R-Code für die setorder()-Methode lautet wie folgt:

Bibliothek ( 'Datentabelle' )

d1 = Daten. rahmen ( Auftragsnummer = C ( 1 , 4 , 2 , 5 , 3 ) ,

Bestellungsartikel = C ( 'Apfel' , 'orange' , 'Kiwi' , 'Mango' , 'Banane' ) )

drucken ( Reihenfolge festlegen ( d1 , Bestellungsartikel ) )

Hier legen wir zuerst die data.table-Bibliothek fest, da setorder() die Funktion dieses Pakets ist. Anschließend verwenden wir die Funktion data.frame(), um den DataFrame zu erstellen. Der DataFrame wird mit nur zwei Spalten angegeben, die wir zum Sortieren verwenden. Danach setzen wir die Funktion setorder() innerhalb der Funktion print(). Die Funktion setorder() verwendet den DataFrame „d1“ als ersten Parameter und die Spalte „orderId“ als zweiten Parameter, nach dem der DataFrame sortiert wird. Die Funktion „setorder“ ordnet die Zeilen der Datentabelle basierend auf den Werten in der Spalte „orderId“ in aufsteigender Reihenfolge neu an.

Der sortierte DataFrame ist die Ausgabe in der folgenden Konsole von R:

Beispiel 6: Sortieren des DataFrame mithilfe der Row.Names()-Methode in R

Die Methode row.names() ist auch eine Möglichkeit, den DataFrame in R zu sortieren. Die Methode row.names() sortiert die DataFrames nach der angegebenen Zeile.

df < - Daten. rahmen ( Team = C ( 'X' , 'X' , 'UND' , 'UND' , 'MIT' ) ,

Punktzahl = C ( 91 , 80 , 86 , 83 , 95 ) )

Reihe. Namen ( df ) < - C ( 'A' , 'D' , 'C' , 'UND' , 'B' )

df [ Befehl ( Reihe. Namen ( df ) ) , ]

Hier wird die Funktion data.frame() innerhalb der Variablen „df“ eingerichtet, in der die Spalten mit den Werten angegeben werden. Anschließend werden die Zeilennamen des DataFrame mithilfe der Funktion row.names() angegeben. Danach rufen wir die Funktion order() auf, um den DataFrame nach Zeilennamen zu sortieren. Die Funktion order() gibt die Indizes der sortierten Zeilen zurück, die zum Neuorganisieren der Zeilen des DataFrame verwendet werden.

Die Ausgabe zeigt den alphabetisch nach Zeilen sortierten DataFrame:

Abschluss

Wir haben die verschiedenen Funktionen zum Sortieren der DataFrames in R gesehen. Jede der Methoden hat einen Vorteil und erfordert die Sortieroperation. Es kann mehr Methoden oder Möglichkeiten geben, den DataFrame in der R-Sprache zu sortieren, aber die Methoden order(), array() und setorder() sind die wichtigsten und am einfachsten zu verwendenden Methoden zum Sortieren.