So lesen Sie eine Excel-Datei (xlsx) in Python?

How Read Excel File Python

Die .xlsx ist die Erweiterung des Excel-Dokuments, die eine große Datenmenge in Tabellenform speichern kann, und viele Arten von arithmetischen und logischen Berechnungen können problemlos in einer Excel-Tabelle durchgeführt werden. Manchmal ist es erforderlich, die Daten aus dem Excel-Dokument mit Python-Skript zu Programmierzwecken zu lesen. In Python gibt es viele Module, um das Excel-Dokument zu lesen. Einige der nützlichen Module sind xlrd , openpyxl , und Pandas . Die Möglichkeiten, diese Module zum Lesen der Excel-Datei in Python zu verwenden, wurden in diesem Tutorial gezeigt.

Voraussetzung:

Eine Dummy-Excel-Datei mit der Erweiterung .xlsx wird benötigt, um die Beispiele dieses Tutorials zu überprüfen. Sie können jede vorhandene Excel-Datei verwenden oder eine neue erstellen. Hier eine neue Excel-Datei namens sales.xlsx Datei wurde mit den folgenden Daten erstellt. Diese Datei wurde im nächsten Teil dieses Tutorials zum Lesen mit verschiedenen Python-Modulen verwendet.



sales.xlsx



Verkaufsdatum Verkäufer Betragen
12.05.18 Sila Ahmed 60000
12.06.19 Mir Hossain 50.000
08.09.20 Sarmin Jahan 45000
04.07.21 Mahmudul Hasan 30000

Beispiel-1: Excel-Datei mit xlrd lesen

Das xlrd-Modul wird standardmäßig nicht mit Python installiert. Sie müssen das Modul also installieren, bevor Sie es verwenden. Die neueste Version dieses Moduls unterstützt die Excel-Datei mit der Erweiterung .xlsx nicht. Sie müssen also die Version 1.2.0 dieses Moduls installieren, um die xlsx-Datei zu lesen. Führen Sie den folgenden Befehl vom Terminal aus, um die erforderliche Version von . zu installieren xlrd .



$PipInstallieren xlrd== 1.2.0

Erstellen Sie nach Abschluss des Installationsvorgangs eine Python-Datei mit dem folgenden Skript, um die sales.xlsx Datei mit die xlrd Modul. open_workbook() Funktion wird im Skript verwendet Öffnen Sie die xlsx-Datei zum Lesen. Diese Excel-Datei enthält nur ein Blatt. Also, die workbook.sheet_by_index() Funktion wurde im Skript mit dem Argumentwert 0 verwendet. Als nächstes wird die verschachtelte 'zum' loop verwendet hat, um die Zellenwerte des Arbeitsblatts anhand der Zeilen- und Spaltenwerte zu lesen. Im Skript wurden zwei range()-Funktionen verwendet, um die Zeilen- und Spaltengröße basierend auf den Blattdaten zu definieren. Die cell_value() Funktion verwendet hat, um den jeweiligen Zellenwert des Blattes in jeder Iteration der Schleife zu lesen. Jedes Feld in der Ausgabe wird durch ein Tabulatorzeichen getrennt.

# Importieren Sie das xlrd-Modul
xlrd importieren

# Öffne die Arbeitsmappe
Arbeitsmappe = xlrd.open_workbook('verkauf.xlsx')

# Öffne das Arbeitsblatt
Arbeitsblatt = Arbeitsmappe.sheet_by_index(0)

# Iteriere die Zeilen und Spalten
zumichinBereich(0,5):
zumJinBereich(0,3):
# Drucken Sie die Zellenwerte mit Tabulator-Leerzeichen
drucken(worksheet.cell_value(ich, j),Ende='T')
drucken('')

Ausgabe:

Die folgende Ausgabe wird erscheinen, nachdem das obige Skript ausgeführt wurde.



Beispiel-2: Excel-Datei mit openpyxl lesen

Die openpyxl ist ein weiteres Python-Modul zum Lesen der xlsx-Datei und wird standardmäßig auch nicht mit Python installiert. Führen Sie den folgenden Befehl vom Terminal aus, um dieses Modul zu installieren, bevor Sie es verwenden.

$PipInstallierenopenpyxl

Erstellen Sie nach Abschluss des Installationsvorgangs eine Python-Datei mit dem folgenden Skript, um die sales.xlsx Datei. Wie das xlrd-Modul, die openpyxl Modul hat die load_workbook() Funktion zum Öffnen der xlsx-Datei zum Lesen. Die sales.xlsx file wird als Argumentwert dieser Funktion verwendet. Das Objekt der buch.aktiv wurde im Skript erstellt, um die Werte der max_row und der max_column Eigenschaften. Diese Eigenschaften wurden in den verschachtelten for-Schleifen verwendet, um den Inhalt der sales.xlsx Datei. Die Funktion range() wurde verwendet, um die Zeilen des Blatts zu lesen, und die Funktion iter_cols() wurde verwendet, um die Spalten des Blatts zu lesen. Jedes Feld in der Ausgabe wird durch zwei Tabulatoren getrennt.

# Openyxl-Modul importieren
openpyxl importieren

# Variable zum Laden des Arbeitsbuchs definieren
Arbeitsbuch = openpyxl.load_workbook('verkauf.xlsx')

# Variable definieren, um das aktive Blatt zu lesen:
Arbeitsblatt = Arbeitsbuch.aktiv

# Iteriere die Schleife, um die Zellenwerte zu lesen
zumichinBereich(0, Arbeitsblatt.max_row):
zum mit dem inArbeitsblatt.iter_cols(1, Arbeitsblatt.max_column):
drucken(mit dem[ich].Wert,Ende='TT')
drucken('')

Ausgabe:

Die folgende Ausgabe wird erscheinen, nachdem das obige Skript ausgeführt wurde.

Beispiel-3: Excel-Datei mit Pandas lesen

Das Pandas-Modul wird nicht wie das vorherige Modul mit Python installiert. Wenn Sie es also noch nicht installiert haben, müssen Sie es installieren. Führen Sie den folgenden Befehl aus, um die zu installieren Pandas vom Terminal.

$PipInstallierenPandas

Erstellen Sie nach Abschluss des Installationsvorgangs eine Python-Datei mit dem folgenden Skript, um die sales.xlsx Datei. Die read_excel() Funktion von pandas wird zum Lesen der xlsx-Datei verwendet. Diese Funktion wurde im Skript verwendet, um die sales.xlsx Datei. Die Datenrahmen() Funktion hat hier verwendet, um den Inhalt der xlsx-Datei im Datenrahmen zu lesen und die Werte in der Variablen namens . zu speichern Daten . Der Wert der Daten wurde später gedruckt.

# Pandas importieren
Pandas importierenwiepd

# Laden Sie die xlsx-Datei
excel_data = pd.read_excel('verkauf.xlsx')
# Lesen Sie die Werte der Datei im Datenrahmen
data = pd.DataFrame(Excel_Daten,Säulen=['Verkaufsdatum','Verkäufer','Betragen'])
# Inhalt ausdrucken
drucken('Der Inhalt der Datei ist: ', Daten)

Ausgabe:

Die folgende Ausgabe wird erscheinen, nachdem das obige Skript ausgeführt wurde. Die Ausgabe dieses Skripts unterscheidet sich von den beiden vorherigen Beispielen. Die Zeilennummern werden in der ersten Spalte gedruckt, wobei der Zeilenwert von 0 an gezählt hat. Die Datumswerte werden mittig ausgerichtet. Die Namen der Verkäufer sind rechts ausgerichtet. Der Betrag ist linksbündig.

Abschluss:

Die Python-Benutzer müssen für verschiedene Programmierzwecke mit xlsx-Dateien arbeiten. In diesem Tutorial wurden drei verschiedene Möglichkeiten zum Lesen der xlsx-Datei mithilfe von drei Python-Modulen gezeigt. Jedes Modul hat unterschiedliche Funktionen und Eigenschaften, um die xlsx-Datei zu lesen. Dieses Tutorial hilft Python-Benutzern, die xlsx-Datei nach dem Lesen dieses Tutorials einfach mit dem Python-Skript zu lesen.