Data Science - Datenbanktabelle


Datenbanktabelle

Eine Datenbanktabelle ist eine Tabelle mit strukturierten Daten.

Die folgende Tabelle zeigt eine Datenbanktabelle mit aus einer Sportuhr extrahierten Gesundheitsdaten:

Dauer Average_Pulse Max_Puls Kalorienverbrauch Stunden_Arbeit Stunden_Schlaf
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Dieser Datensatz enthält Informationen einer typischen Trainingseinheit wie Dauer, durchschnittlicher Puls, Kalorienverbrauch etc.


Datenbanktabellenstruktur

Eine Datenbanktabelle besteht aus Spalte(n) und Zeile(n):

Spalte 1 Spalte 2 Spalte 3 Spalte 4 Spalte 5 Spalte 6
Dauer Average_Pulse Max_Puls Kalorienverbrauch Stunden_Arbeit Stunden_Schlaf
Reihe 1 30 80 120 240 10 7
Reihe 2 30 85 120 250 10 7
Reihe 3 45 90 130 260 8 7
Reihe 4 45 95 130 270 8 7
Reihe 5 45 100 140 280 0 7
Reihe 6 60 105 140 290 7 8
Reihe 7 60 110 145 300 7 8
Reihe 8 60 115 145 310 8 8
Reihe 9 75 120 150 320 0 8
Reihe 10 75 125 150 330 8 8

Eine Zeile ist eine horizontale Darstellung von Daten.

Eine Spalte ist eine vertikale Darstellung von Daten.


Variablen

Eine Variable ist definiert als etwas, das gemessen oder gezählt werden kann.

Beispiele können Zeichen, Zahlen oder Zeiten sein.

Im folgenden Beispiel können wir beobachten, dass jede Spalte eine Variable darstellt.

Dauer Average_Pulse Max_Puls Kalorienverbrauch Stunden_Arbeit Stunden_Schlaf
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Es gibt 6 Spalten, was bedeutet, dass es 6 Variablen gibt (Duration, Average_Pulse, Max_Pulse, Calorie_Burnage, Hours_Work, Hours_Sleep).

Es gibt 11 Zeilen, was bedeutet, dass jede Variable 10 Beobachtungen hat.

Aber wenn es 11 Zeilen gibt, wie kommt es dann, dass es nur 10 Beobachtungen gibt?

Dies liegt daran, dass die erste Zeile das Label ist, was bedeutet, dass es sich um den Namen der Variablen handelt.