Data Science- Funktionen


Dieses Kapitel zeigt drei häufig verwendete Funktionen bei der Arbeit mit Data Science: max(), min() und mean().


Der Sportuhr-Datensatz

Dauer Average_Pulse Max_Puls Kalorienverbrauch Stunden_Arbeit Stunden_Schlaf
30 80 120 240 10 7
30 85 120 250 10 7
45 90 130 260 8 7
45 95 130 270 8 7
45 100 140 280 0 7
60 105 140 290 7 8
60 110 145 300 7 8
60 115 145 310 8 8
75 120 150 320 0 8
75 125 150 330 8 8

Der obige Datensatz besteht aus 6 Variablen mit jeweils 10 Beobachtungen:

  • Dauer - Wie lange hat die Trainingseinheit in Minuten gedauert?
  • Average_Pulse - Was war der durchschnittliche Puls der Trainingseinheit? Dies wird in Schlägen pro Minute gemessen
  • Max_Pulse - Was war der maximale Puls der Trainingseinheit?
  • Calorie_Burnage – Wie viele Kalorien wurden während der Trainingseinheit verbrannt?
  • Stunden_Arbeit – Wie viele Stunden haben wir vor der Schulung an unserem Arbeitsplatz gearbeitet?
  • Hours_Sleep – Wie viel haben wir in der Nacht vor der Trainingseinheit geschlafen?

Wir verwenden den Unterstrich (_), um Zeichenfolgen zu trennen, da Python kein Leerzeichen als Trennzeichen lesen kann.



Die Funktion max()

Die Python max()-Funktion wird verwendet, um den höchsten Wert in einem Array zu finden.

Beispiel

Average_pulse_max = max(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_max)

Die Funktion min()

Die Python min()-Funktion wird verwendet, um den niedrigsten Wert in einem Array zu finden.

Beispiel

Average_pulse_min = min(80, 85, 90, 95, 100, 105, 110, 115, 120, 125)

print (Average_pulse_min)

Die mean()-Funktion

Die NumPy mean()-Funktion wird verwendet, um den Durchschnittswert eines Arrays zu finden.

Beispiel

import numpy as np

Calorie_burnage = [240, 250, 260, 270, 280, 290, 300, 310, 320, 330]

Average_calorie_burnage = np.mean(Calorie_burnage)

print(Average_calorie_burnage)

Wir schreiben np. vor mean , um Python mitzuteilen, dass wir die mean - Funktion aus der Numpy- Bibliothek aktivieren wollen.