Pandas DataFrames


Was ist ein DataFrame?

Ein Pandas DataFrame ist eine zweidimensionale Datenstruktur, wie ein zweidimensionales Array oder eine Tabelle mit Zeilen und Spalten.

Beispiel

Erstellen Sie einen einfachen Pandas DataFrame:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

#load data into a DataFrame object:
df = pd.DataFrame(data)

print(df) 

Ergebnis

     calories  duration
  0       420        50
  1       380        40
  2       390        45


Suchen Sie Zeile

Wie Sie dem obigen Ergebnis entnehmen können, ist der DataFrame wie eine Tabelle mit Zeilen und Spalten.

Pandas verwenden das locAttribut, um eine oder mehrere angegebene(n) Zeile(n) zurückzugeben.

Beispiel

Zeile 0 zurückgeben:

#refer to the row index:
print(df.loc[0])

Ergebnis

  calories    420
  duration     50
  Name: 0, dtype: int64

Hinweis: Dieses Beispiel gibt eine Pandas Series zurück .

Beispiel

Zeile 0 und 1 zurückgeben:

#use a list of indexes:
print(df.loc[[0, 1]])

Ergebnis

     calories  duration
  0       420        50
  1       380        40

Hinweis: Bei Verwendung []von ist das Ergebnis ein Pandas DataFrame .


w3schools CERTIFIED . 2021

Zertifiziert werden!

Absolvieren Sie die Pandas-Module, machen Sie die Übungen, machen Sie die Prüfung und Sie werden w3schools-zertifiziert!

$10 REGISTRIEREN

Benannte Indizes

Mit dem indexArgument können Sie Ihre eigenen Indizes benennen.

Beispiel

Fügen Sie eine Liste mit Namen hinzu, um jeder Zeile einen Namen zu geben:

import pandas as pd

data = {
  "calories": [420, 380, 390],
  "duration": [50, 40, 45]
}

df = pd.DataFrame(data, index = ["day1", "day2", "day3"])

print(df) 

Ergebnis

        calories  duration
  day1       420        50
  day2       380        40
  day3       390        45

Suchen Sie benannte Indizes

Verwenden Sie den benannten Index im locAttribut, um die angegebene(n) Zeile(n) zurückzugeben.

Beispiel

Geben Sie "Tag2" zurück:

#refer to the named index:
print(df.loc["day2"])

Ergebnis

  calories    380
  duration     40
  Name: 0, dtype: int64


Dateien in einen DataFrame laden

Wenn Ihre Datensätze in einer Datei gespeichert sind, können Pandas sie in einen DataFrame laden.

Beispiel

Laden Sie eine kommagetrennte Datei (CSV-Datei) in einen DataFrame:

import pandas as pd

df = pd.read_csv('data.csv')

print(df) 

In den nächsten Kapiteln erfahren Sie mehr über das Importieren von Dateien.


Testen Sie sich mit Übungen

Übung:

Fügen Sie die richtige Pandas-Methode ein, um einen DataFrame zu erstellen.

pd.(data)