Data Science - Datenbanktabelle
Datenbanktabelle
Eine Datenbanktabelle ist eine Tabelle mit strukturierten Daten.
Die folgende Tabelle zeigt eine Datenbanktabelle mit aus einer Sportuhr extrahierten Gesundheitsdaten:
Dauer | Average_Pulse | Max_Puls | Kalorienverbrauch | Stunden_Arbeit | Stunden_Schlaf |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Dieser Datensatz enthält Informationen einer typischen Trainingseinheit wie Dauer, durchschnittlicher Puls, Kalorienverbrauch etc.
Datenbanktabellenstruktur
Eine Datenbanktabelle besteht aus Spalte(n) und Zeile(n):
Spalte 1 | Spalte 2 | Spalte 3 | Spalte 4 | Spalte 5 | Spalte 6 | |
Dauer | Average_Pulse | Max_Puls | Kalorienverbrauch | Stunden_Arbeit | Stunden_Schlaf | |
---|---|---|---|---|---|---|
Reihe 1 | 30 | 80 | 120 | 240 | 10 | 7 |
Reihe 2 | 30 | 85 | 120 | 250 | 10 | 7 |
Reihe 3 | 45 | 90 | 130 | 260 | 8 | 7 |
Reihe 4 | 45 | 95 | 130 | 270 | 8 | 7 |
Reihe 5 | 45 | 100 | 140 | 280 | 0 | 7 |
Reihe 6 | 60 | 105 | 140 | 290 | 7 | 8 |
Reihe 7 | 60 | 110 | 145 | 300 | 7 | 8 |
Reihe 8 | 60 | 115 | 145 | 310 | 8 | 8 |
Reihe 9 | 75 | 120 | 150 | 320 | 0 | 8 |
Reihe 10 | 75 | 125 | 150 | 330 | 8 | 8 |
Eine Zeile ist eine horizontale Darstellung von Daten.
Eine Spalte ist eine vertikale Darstellung von Daten.
Variablen
Eine Variable ist definiert als etwas, das gemessen oder gezählt werden kann.
Beispiele können Zeichen, Zahlen oder Zeiten sein.
Im folgenden Beispiel können wir beobachten, dass jede Spalte eine Variable darstellt.
Dauer | Average_Pulse | Max_Puls | Kalorienverbrauch | Stunden_Arbeit | Stunden_Schlaf |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Es gibt 6 Spalten, was bedeutet, dass es 6 Variablen gibt (Duration, Average_Pulse, Max_Pulse, Calorie_Burnage, Hours_Work, Hours_Sleep).
Es gibt 11 Zeilen, was bedeutet, dass jede Variable 10 Beobachtungen hat.
Aber wenn es 11 Zeilen gibt, wie kommt es dann, dass es nur 10 Beobachtungen gibt?
Dies liegt daran, dass die erste Zeile das Label ist, was bedeutet, dass es sich um den Namen der Variablen handelt.