Data Science - Einführung in die Statistik


Einführung in die Statistik

Statistik ist die Wissenschaft der Datenanalyse.

Wenn wir ein Vorhersagemodell erstellt haben, müssen wir die Zuverlässigkeit der Vorhersage bewerten.

Denn was ist eine Vorhersage wert, wenn wir uns nicht darauf verlassen können?


Beschreibende Statistik

Wir werden zunächst einige grundlegende deskriptive Statistiken behandeln.

Die deskriptive Statistik fasst wichtige Merkmale eines Datensatzes zusammen, wie z. B.:

  • Zählen
  • Summe
  • Standardabweichung
  • Perzentil
  • Durchschnitt
  • Etc..

Es ist ein guter Ausgangspunkt, um sich mit den Daten vertraut zu machen.

Wir können die describe()Funktion in Python verwenden, um die Daten zusammenzufassen:

Beispiel

print (full_health_data.describe())

Ausgabe:

Statistik beschreiben

Sehen Sie hier etwas Interessantes?