Pandas -Serie
Was ist eine Serie?
Eine Pandas-Serie ist wie eine Spalte in einer Tabelle.
Es ist ein eindimensionales Array, das Daten jeglicher Art enthält.
Beispiel
Erstellen Sie eine einfache Pandas-Serie aus einer Liste:
import pandas as pd
a = [1, 7, 2]
myvar = pd.Series(a)
print(myvar)
Etiketten
Wenn nichts anderes angegeben ist, werden die Werte mit ihrer Indexnummer gekennzeichnet. Erster Wert hat Index 0, zweiter Wert hat Index 1 usw.
Dieses Label kann verwendet werden, um auf einen bestimmten Wert zuzugreifen.
Beispiel
Gibt den ersten Wert der Serie zurück:
print(myvar[0])
Etiketten erstellen
Mit dem index
Argument können Sie Ihre eigenen Labels benennen.
Beispiel
Erstellen Sie Ihre eigenen Etiketten:
import pandas as pd
a = [1, 7, 2]
myvar = pd.Series(a, index = ["x", "y", "z"])
print(myvar)
Wenn Sie Etiketten erstellt haben, können Sie auf ein Element zugreifen, indem Sie auf das Etikett verweisen.
Beispiel
Geben Sie den Wert von "y" zurück:
print(myvar["y"])
Zertifiziert werden!
$10 REGISTRIEREN
Schlüssel/Wert-Objekte als Serie
Sie können beim Erstellen einer Serie auch ein Schlüssel/Wert-Objekt wie ein Wörterbuch verwenden.
Beispiel
Erstellen Sie eine einfache Pandas-Serie aus einem Wörterbuch:
import pandas as pd
calories = {"day1": 420, "day2": 380, "day3":
390}
myvar = pd.Series(calories)
print(myvar)
Hinweis: Die Schlüssel des Wörterbuchs werden zu Beschriftungen.
Um nur einige der Elemente im Wörterbuch auszuwählen, verwenden Sie das index
Argument und geben Sie nur die Elemente an, die Sie in die Reihe aufnehmen möchten.
Beispiel
Erstellen Sie eine Serie, die nur Daten von „Tag1“ und „Tag2“ verwendet:
import pandas as pd
calories = {"day1": 420, "day2": 380, "day3":
390}
myvar = pd.Series(calories,
index = ["day1", "day2"])
print(myvar)
Datenrahmen
Datensätze in Pandas sind normalerweise mehrdimensionale Tabellen, die als DataFrames bezeichnet werden.
Series ist wie eine Spalte, ein DataFrame ist die ganze Tabelle.
Beispiel
Erstellen Sie einen DataFrame aus zwei Serien:
import pandas as pd
data = {
"calories": [420, 380, 390],
"duration":
[50, 40, 45]
}
myvar = pd.DataFrame(data)
print(myvar)
Im nächsten Kapitel lernen Sie DataFrames kennen .