Eines der wichtigsten Werkzeuge für die Arbeit mit Daten in Python ist die Numpy-Bibliothek, die Funktionen für die Arbeit mit mehrdimensionalen Arrays und Matrizen bereitstellt. Es ist die Grundlage vieler anderer Pakete, wie Pandas und Scikit-learn, und wird häufig in der Datenanalyse und im maschinellen Lernen verwendet.
Wenn wir mit Daten in Python arbeiten, ist es oft erforderlich, sie in andere Formate wie Excel zu exportieren. Excel ist eines der beliebtesten Tools für die Arbeit mit Tabellendaten und wird häufig in Geschäfts- und Forschungsarbeiten verwendet.
In diesem Artikel erfahren Sie, wie Sie ein Array von Daten im Numpy Dataframe-Format in das Excel-Format konvertieren. Wir werden mit der Pandas-Bibliothek verschiedene Möglichkeiten erkunden und Codebeispiele zeigen, um sie zu implementieren.
Vorbereiten der Daten für den Export
Bevor Sie Daten aus einem Numpy Dataframe nach Excel exportieren, müssen Sie die Daten ordnungsgemäß vorbereiten, um sicherzustellen, dass sie in der Excel-Tabelle korrekt angezeigt werden. In diesem Abschnitt werden einige wichtige Schritte erläutert, die Sie möglicherweise zum Vorbereiten der Daten für den Export benötigen.
1. Entfernen unnötiger Spalten
Vor dem Exportieren von Daten müssen Sie möglicherweise Spalten löschen, die für die Analyse oder Anzeige in Excel nicht benötigt werden. Sie können dazu die Funktion numpy verwenden.delete und geben Sie die zu löschenden Spaltenindizes an.
2. Konvertieren von Datentypen
Excel unterstützt verschiedene Datentypen, und einige Datentypen werden möglicherweise nicht korrekt angezeigt, wenn sie nicht mit den Excel-Datentypen übereinstimmen. Daher müssen Sie sicherstellen, dass alle Spalten über die richtigen Datentypen verfügen, bevor Sie die Daten nach Excel exportieren.
Sie können die Funktion numpy verwenden, um Datentypen zu konvertieren.astype . Wenn Sie beispielsweise eine Spalte in einen numerischen Datentyp konvertieren müssen:
3. Behandeln fehlender Werte
Excel verarbeitet fehlende Werte (NaN) nicht sehr gut, daher müssen Sie möglicherweise fehlende Werte ersetzen oder entfernen, bevor Sie Daten exportieren.
Sie können die Funktion numpy verwenden, um fehlende Werte zu ersetzen.fillna . Zum Beispiel, wenn Sie alle fehlenden Werte durch 0 ersetzen müssen:
Oder Sie können Zeilen löschen, die fehlende Werte enthalten:
4. Duplikate verarbeiten
Excel kann doppelte Zeilen möglicherweise nicht korrekt verarbeiten, daher müssen Sie alle Duplikate entfernen, bevor Sie die Daten exportieren.
Sie können die Funktion numpy verwenden, um Duplikate zu entfernen.drop_duplicates . Zum Beispiel, wenn Sie alle doppelten Zeilen entfernen müssen:
Nachdem Sie diese Schritte ausgeführt haben, sollten die Daten für den Export nach Excel bereit sein. Sie können die Daten in einer Excel-Datei mit der OpenPyXL-Bibliothek oder einer anderen geeigneten Excel-Bibliothek speichern.
Installieren der benötigten Bibliotheken
Um mit einem Numpy Dataframe zu arbeiten und ihn in das Excel-Format zu konvertieren, müssen Sie mehrere Bibliotheken installieren:
Numpy - bibliothek für die Arbeit mit Arrays und Datenmatrizen. Es bietet Funktionen zum Ausführen verschiedener Datenoperationen wie Sortieren, Filtern, Aggregieren und vieles mehr.
pip install numpy
Pandas - bibliothek zur Manipulation und Analyse von Daten. Es bietet praktische und effektive Tools zum Lesen, Schreiben und Verarbeiten strukturierter Daten, einschließlich Unterstützung für verschiedene Datenformate, einschließlich Excel.
pip install pandas
Openpyxl - bibliothek für die Arbeit mit Excel-Dateien im Format. Es ermöglicht Ihnen, Daten im Excel-Format zu erstellen, zu bearbeiten und zu lesen, einschließlich der Möglichkeit, mit verschiedenen Arbeitsblättern und Zellen zu arbeiten.
pip install openpyxl
Nachdem Sie die aufgelisteten Bibliotheken installiert haben, können Sie mit der Konvertierung des Numpy dataframe in das Excel-Format beginnen.
Konvertieren von Daten in das Pandas Dataframe-Format
Sie können die Funktion in der NumPy-Bibliothek verwenden numpy.ndarray.tolist() um ein NumPy-Array in ein Python-List-Objekt zu konvertieren. Und dann mit der Funktion pandas.DataFrame() aus der Pandas-Bibliothek können Sie diese Liste in das Pandas-Dataframe-Format konvertieren.
Die Konvertierung von Daten von NumPy in das Pandas Dataframe-Format kann in folgende Schritte unterteilt werden:
-
Erforderliche Bibliotheken importieren:
import numpy as npimport pandas as pd
numpy_array = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
python_list = numpy_array.tolist()
dataframe = pd.DataFrame(python_list)
Jetzt haben Sie Daten im Pandas Dataframe-Format, mit denen Sie weiter arbeiten können. Sie können beispielsweise verschiedene Datenoperationen durchführen und sie in verschiedenen Formaten speichern, einschließlich des CSV- oder Excel-Formats.
Exportieren von Daten in eine Excel-Datei
Schritt 1: Installieren Sie die Pandas-Bibliothek, falls sie noch nicht installiert ist:
!pip install pandas
Schritt 2: Importieren Sie die benötigten Bibliotheken:
import pandas as pd
Schritt 3: Erstellen Sie ein DataFrame-Objekt aus einem Numpy dataframe:
dataframe = pd.DataFrame(numpy_dataframe)
Schritt 4: Exportieren Sie den DataFrame in eine Excel-Datei:
dataframe.to_excel('путь_к_файлу.xlsx ')
Standardmäßig speichert die to_excel() -Methode den DataFrame im ersten Excel-Arbeitsblatt der Datei und speichert die Zeilenindizes. Um Daten ohne Zeilenindizes zu speichern, können Sie den Parameter index=False verwenden:
dataframe.to_excel('путь_к_файлу.xlsx ', index=False)
Die Daten aus dem Numpy Dataframe werden jetzt in eine Excel-Datei exportiert.
Überprüfen der Exportergebnisse
Nachdem Sie Daten aus einem Numpy Dataframe in das Excel-Format exportiert haben, ist es wichtig, die Ergebnisse zu überprüfen, um sicherzustellen, dass der Export korrekt ist. Hier sind einige Schritte, die Ihnen dabei helfen können:
1. Öffnen Sie die Excel-Datei: Bevor Sie das Exportergebnis überprüfen können, müssen Sie die exportierte Excel-Datei öffnen. Suchen Sie die Datei auf Ihrem Computer und doppelklicken Sie darauf, um sie in Excel zu öffnen.
2. Daten anzeigen: Überprüfen Sie nach dem Öffnen der Excel-Datei die Daten, um sicherzustellen, dass sie korrekt sind. Stellen Sie sicher, dass alle Spalten und Zeilen korrekt angezeigt werden, und überprüfen Sie die Daten auf Fehler oder falsche Werte.
3. Überprüfen Sie die Formatierung: Stellen Sie sicher, dass die Datenformatierung in der Excel-Datei gespeichert ist. Stellen Sie sicher, dass die Zahlen korrekt angezeigt werden, die Daten das richtige Format haben und überprüfen Sie auch die anderen zu speichernden Datenformate.
4. Überprüfen Sie die Blätter: Wenn Ihr Numpy Dataframe mehrere Arbeitsblätter enthält, stellen Sie sicher, dass alle Arbeitsblätter korrekt exportiert werden. Wechseln Sie zwischen den Arbeitsblättern in der Excel-Datei und überprüfen Sie die Daten in jedem Arbeitsblatt.
5. Testen Sie die Funktionalität: Stellen Sie sicher, dass die Daten in der Excel-Datei genauso bearbeitet und verarbeitet werden können wie in einem Numpy Dataframe. Versuchen Sie, neue Daten hinzuzufügen, vorhandene Daten zu ändern, Filter oder Funktionen auf die Daten anzuwenden, und stellen Sie sicher, dass alles ordnungsgemäß funktioniert.
Beachten Sie beim Überprüfen der Exportergebnisse, dass es zu Abweichungen zwischen einem Numpy Dataframe und Excel kommen kann. Dies kann aufgrund unterschiedlicher Datenformate, Unterschiede in den unterstützten Funktionen oder anderer Merkmale des Exportformats auftreten. Es ist wichtig zu überprüfen, ob die Daten korrekt gespeichert sind und dass die Excel-Datei Ihren Erwartungen entspricht.