Data Science - Einführung in die Statistik
Einführung in die Statistik
Statistik ist die Wissenschaft der Datenanalyse.
Wenn wir ein Vorhersagemodell erstellt haben, müssen wir die Zuverlässigkeit der Vorhersage bewerten.
Denn was ist eine Vorhersage wert, wenn wir uns nicht darauf verlassen können?
Beschreibende Statistik
Wir werden zunächst einige grundlegende deskriptive Statistiken behandeln.
Die deskriptive Statistik fasst wichtige Merkmale eines Datensatzes zusammen, wie z. B.:
- Zählen
- Summe
- Standardabweichung
- Perzentil
- Durchschnitt
- Etc..
Es ist ein guter Ausgangspunkt, um sich mit den Daten vertraut zu machen.
Wir können die describe()
Funktion in Python verwenden, um die Daten zusammenzufassen:
Beispiel
print (full_health_data.describe())
Ausgabe:
Sehen Sie hier etwas Interessantes?