Python ist eine leistungsfähige und beliebte Programmiersprache, die häufig für verschiedene Aufgaben verwendet wird, einschließlich der Arbeit mit Daten. Eines der gängigen Datenformate ist Excel, und in diesem Artikel werden wir uns ansehen, wie man eine Excel-Datei mit Python herunterlädt.
Es gibt mehrere Bibliotheken für die Arbeit mit Excel-Dateien in Python, z. B. Pandas, openpyxl und xlwt. In diesem Artikel werden wir uns mit der Pandas-Bibliothek befassen, die leistungsstarke Werkzeuge für die Arbeit mit Excel-Daten bietet.
Zuerst müssen Sie die Pandas-Bibliothek installieren, indem Sie den Befehl pip install pandas an der Eingabeaufforderung ausführen. Dann können wir die Funktionen und Methoden dieser Bibliothek verwenden, um die Daten zu erstellen und in einer Excel-Datei zu speichern.
Zum Erstellen von Daten können wir Pandas-Datenstrukturen wie DataFrame verwenden. Dann können wir diesen DataFrame in eine Excel-Datei speichern, indem wir den Dateipfad und den Dateinamen entsprechend angeben. Danach können wir diese Excel-Datei herunterladen und zur weiteren Datenverarbeitung verwenden.
Abrufen einer Excel-Datei mit Python
Python bietet viele Werkzeuge zum Arbeiten mit Dateien verschiedener Formate, einschließlich Excel. Sie können spezielle Bibliotheken verwenden, um eine Excel-Datei mit Python abzurufen, z. B. pandas und openpyxl.
Die Bibliothek pandas bietet die Möglichkeit, mit Daten im Excel-Format zu arbeiten und Daten aus/in Excel-Dateien zu lesen und zu schreiben. Führen Sie den folgenden Befehl aus, um die Bibliothek zu installieren:
pip install pandas
Nachdem Sie die Bibliothek installiert haben, können Sie mit dem Abrufen der Excel-Datei beginnen. Erstellen Sie dazu ein Objekt, das die Datentabelle darstellt, und füllen Sie es mit Werten aus. Dann können Sie die Methode verwenden to_excel() so speichern Sie eine Tabelle in einer Excel-Datei:
import pandas as pd# Создание таблицы данныхdata = df = pd.DataFrame(data)# Сохранение таблицы в файл Exceldf.to_excel('файл.xlsx', index=False)
Nachdem der Code ausgeführt wurde, wird die Datei "Datei" erstellt.xlsx", das eine Datentabelle im Excel-Format enthält.
Eine andere Möglichkeit, eine Excel-Datei mit Python zu erhalten, ist die Verwendung einer Bibliothek openpyxl. Mit dieser Bibliothek können Sie mit Excel-Dateien arbeiten, ihren Inhalt ändern, neue Dateien erstellen und vieles mehr. Führen Sie den folgenden Befehl aus, um die Bibliothek zu installieren:
pip install openpyxl
Nachdem Sie die Bibliothek installiert haben, können Sie mit der Arbeit mit der Excel-Datei beginnen. Im folgenden Beispiel wird eine neue Excel-Datei erstellt, mit Daten gefüllt und gespeichert:
from openpyxl import Workbook# Создание нового файла Excelwb = Workbook()# Создание нового листаsheet = wb.active# Заполнение ячеек даннымиsheet['A1'] = 'Имя'sheet['B1'] = 'Возраст'sheet['C1'] = 'Зарплата'sheet['A2'] = 'Иван'sheet['B2'] = 25sheet['C2'] = 30000sheet['A3'] = 'Олег'sheet['B3'] = 30sheet['C3'] = 40000sheet['A4'] = 'Мария'sheet['B4'] = 27sheet['C4'] = 35000# Сохранение файлаwb.save('файл.xlsx')
Nachdem der Code ausgeführt wurde, wird die Datei "Datei" erstellt.xlsx" mit ausgefüllten Daten.
Auf diese Weise können Sie mit Python und den entsprechenden Bibliotheken eine Excel-Datei problemlos abrufen und mit Daten füllen sowie viele andere Operationen mit Excel-Dateien durchführen.
Installieren der Pandas-Bibliothek
Die Pandas-Bibliothek bietet umfangreiche Möglichkeiten, mit Daten in einem Tabellenformat zu arbeiten, das einer Excel-Tabelle ähnelt. Um die Pandas-Bibliothek zu verwenden, muss sie installiert werden.
Führen Sie die folgenden Schritte aus, um die Pandas-Bibliothek zu installieren:
- Öffnen Sie eine Eingabeaufforderung oder ein Terminal.
- Geben Sie den Befehl pip install pandas ein und drücken Sie die Eingabetaste.
- Warten Sie, bis die Installation abgeschlossen ist. Wenn die Installation erfolgreich war, sollte eine Meldung angezeigt werden, dass die Installation erfolgreich war.
- Überprüfen Sie die Installation, indem Sie den Befehl import pandas im Python-Interpreter ohne Fehler eingeben.
Nachdem Sie die Pandas-Bibliothek installiert haben, können Sie damit beginnen, mit Excel-Dateien in Python zu arbeiten. Sie können Excel-Dateien lesen, bearbeiten, analysieren und Daten im Excel-Format speichern.
Die Pandas-Bibliothek verfügt über leistungsstarke Funktionen, mit denen Sie Daten bequem und effizient in Python bearbeiten können. Sie ist eine der beliebtesten Bibliotheken für die Arbeit mit Daten und wird im Bereich der Datenanalyse und der wissenschaftlichen Forschung weit verbreitet eingesetzt.
Erstellen und Füllen von Daten in Excel
Bevor Sie mit der Arbeit beginnen openpyxl Sie müssen diese Bibliothek mit dem folgenden Befehl installieren:
pip install openpyxl
Nachdem die Bibliothek erfolgreich installiert wurde, können wir beginnen, Excel-Dateien zu erstellen und zu füllen. Erstellen Sie eine neue Datei und fügen Sie einige Daten hinzu:
# Erstellen Sie ein neues Dokument .xlsx
# Wählen Sie das aktive Blatt aus
# Füllen Sie die Zellen mit Daten aus
Im obigen Beispiel haben wir ein neues Excel-Dokument mit der Funktion openpyxl erstellt.Workbook() . Dann haben wir das aktive Arbeitsblatt ausgewählt und die Zellen mit Spalten- und Zeilenbezeichnungen mit Daten gefüllt.
Nachdem wir die Daten ausgefüllt haben, haben wir die Datei mit der save() -Methode gespeichert und ihren Namen angegeben - die Daten.xlsx.
Jetzt haben wir eine erstellte und ausgefüllte Excel-Datei, die geöffnet und verwendet werden kann.
Hochladen von Daten in eine Excel-Datei
Python bietet leistungsstarke Tools zum Arbeiten mit Excel-Dateien. Mit diesen können Sie Daten im Excel-Format erstellen, bearbeiten und lesen. Ihre Aufgabe kann das Hochladen von Daten aus einer Datenbank oder einer anderen Quelle umfassen und sie zur späteren Verwendung in einer Excel-Datei speichern.
Sie können verschiedene Bibliotheken von Drittanbietern wie openpyxl, xlwt oder Pandas verwenden, um mit Excel-Dateien in Python zu arbeiten. Betrachten Sie in diesem Abschnitt die Verwendung der openpyxl-Bibliothek.
Schritte zum Hochladen von Daten in eine Excel-Datei mithilfe der openpyxl-Bibliothek:
- Installieren Sie openpyxl: pip install openpyxl .
- Importieren Sie die erforderlichen Module: from openpyxl import Workbook , from openpyxl.utils.dataframe import dataframe_to_rows .
- Erstellen Sie ein Arbeitsmappenobjekt: workbook = Workbook() .
- Erstellen Sie ein Arbeitsblatt in einer Arbeitsmappe: sheet = workbook.active .
- Laden Sie die Daten in ein Arbeitsblatt: for row in dataframe_to_rows(dataframe, index=False, header=True): sheet.append(row) , wobei der Dataframe Ihr DataFrame mit den Daten ist.
- Speichern Sie die Arbeitsmappe in einer Datei: workbook.save(filename='output.xlsx') .
Dies ist ein grundlegendes Beispiel, das Sie erweitern und an Ihre Bedürfnisse anpassen können. Sie können sich die Dokumentation der openpyxl-Bibliothek ansehen, um mehr über andere Funktionen zu erfahren, z. B. das Formatieren von Zellen, das Erstellen von Diagrammen usw.
Nachdem Sie den Code ausgeführt haben, haben Sie eine Excel-Datei mit den hochgeladenen Daten, die Sie in Microsoft Excel-Anwendungen oder anderen Datenverarbeitungskomplexen öffnen und verwenden können.
Lesen von Daten aus einer Excel-Datei
Python bietet leistungsstarke Tools zum Lesen von Daten aus Excel-Dateien, mit denen Sie Daten aus solchen Dateien lesen und zur weiteren Verarbeitung verwenden können. Verschiedene Bibliotheken können zu diesem Zweck verwendet werden, z. B. pandas, openpyxl und xlrd.
Die Bibliothek pandas bietet praktische Methoden zum Lesen von Daten aus Excel-Dateien. Zuerst müssen Sie diese Bibliothek mit dem Befehl installieren:
pip install pandas
Nach der Installation der Bibliothek können Sie die Pandas-Funktion verwenden.read_excel() zum Lesen von Daten aus einer Excel-Datei. Hier ist ein Beispielcode:
import pandas as pd# Чтение данных из файла Exceldata = pd.read_excel('file.xlsx')# Вывод данныхprint(data)
In diesem Beispiel liest die Funktion read_excel() Daten aus der Datei file.xlsx und speichert sie in einer Datenvariablen . Die Daten werden dann mit der Funktion print() auf dem Bildschirm angezeigt. Um mit einer Excel-Datei zu arbeiten, müssen Sie den vollständigen Pfad oder Dateinamen angeben, wenn sie sich im selben Ordner wie das Skript befindet.
Die Bibliothek openpyxl sie können auch Daten aus Excel-Dateien lesen. Führen Sie den Befehl aus, um diese Bibliothek zu installieren:
pip install openpyxl
Anschließend können Sie den folgenden Code zum Lesen der Daten verwenden:
import openpyxl# Открытие файла Excelwb = openpyxl.load_workbook('file.xlsx')# Выбор активного листаsheet = wb.active# Чтение данныхfor row in sheet.iter_rows(values_only=True):print(row)
In diesem Beispiel öffnet die Funktion load_workbook() eine Excel-Datei und speichert sie in der Variablen wb . Anschließend wird das aktive Arbeitsblatt mithilfe des active-Attributs ausgewählt. Zum Lesen von Daten wird eine for-Schleife verwendet, in der die iter_rows() -Methode zum Abrufen aller Datenzeilen in einer Tabelle verwendet wird. Das Ergebnis wird mit der Funktion print() angezeigt.
Die Bibliothek xlrd bietet auch eine Funktion zum Lesen von Daten aus Excel-Dateien. Führen Sie den Befehl aus, um diese Bibliothek zu installieren:
pip install xlrd
Als nächstes können Sie den folgenden Code verwenden:
import xlrd# Открытие файла Excelwb = xlrd.open_workbook('file.xlsx')# Выбор активного листаsheet = wb.sheet_by_index(0)# Чтение данныхfor row in range(sheet.nrows):print(sheet.row_values(row))
In diesem Beispiel öffnet die Funktion open_workbook() eine Excel-Datei und speichert sie in der Variablen wb . Anschließend wird das aktive Blatt mit der Methode sheet_by_index() ausgewählt, an das der Index des Blattes übergeben wird (0 ist das erste Blatt). Zum Lesen der Daten wird eine for-Schleife verwendet, in der die row_values() -Methode zum Abrufen der Daten jeder Zeile verwendet wird. Das Ergebnis wird mit der Funktion print() angezeigt.
Auf diese Weise können Sie mit Python Daten aus Excel-Dateien einfach und bequem lesen und für verschiedene Aufgaben verwenden.