Data Science - Zeichnen linearer Funktionen
Der Sportuhr-Datensatz
Schauen Sie sich unseren Gesundheitsdatensatz an:
Dauer | Average_Pulse | Max_Puls | Kalorienverbrauch | Stunden_Arbeit | Stunden_Schlaf |
---|---|---|---|---|---|
30 | 80 | 120 | 240 | 10 | 7 |
30 | 85 | 120 | 250 | 10 | 7 |
45 | 90 | 130 | 260 | 8 | 7 |
45 | 95 | 130 | 270 | 8 | 7 |
45 | 100 | 140 | 280 | 0 | 7 |
60 | 105 | 140 | 290 | 7 | 8 |
60 | 110 | 145 | 300 | 7 | 8 |
60 | 115 | 145 | 310 | 8 | 8 |
75 | 120 | 150 | 320 | 0 | 8 |
75 | 125 | 150 | 330 | 8 | 8 |
Zeichnen Sie die vorhandenen Daten in Python
Jetzt können wir zuerst die Werte von Average_Pulse gegen Calorie_Burnage mit der Matplotlib-Bibliothek darstellen.
Die plot()
Funktion wird verwendet, um ein sechseckiges 2D-Binning-Plot der Punkte x,y zu erstellen:
Beispiel
import matplotlib.pyplot as plt
health_data.plot(x ='Average_Pulse',
y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0)
plt.xlim(xmin=0)
plt.show()
Beispiel erklärt
- Importieren Sie das Pyplot-Modul der Matplotlib-Bibliothek
- Zeichnen Sie die Daten von Average_Pulse gegen Calorie_Burnage
kind='line'
sagt uns, welche Art von Handlung wir wollen. Hier wollen wir eine gerade Linie haben- plt.ylim() und plt.xlim() sagen uns, mit welchem Wert die Achse beginnen soll. Hier möchten wir, dass die Achse bei Null beginnt
- plt.show() zeigt uns die Ausgabe
Der obige Code erzeugt das folgende Ergebnis:
Die Grafikausgabe
Wie wir sehen können, besteht eine Beziehung zwischen Average_Pulse und Calorie_Burnage. Calorie_Burnage steigt proportional mit Average_Pulse. Das bedeutet, dass wir Average_Pulse verwenden können, um Calorie_Burnage vorherzusagen.
Warum wird die Linie nicht vollständig auf die y-Achse gezogen?
Der Grund dafür ist, dass wir keine Beobachtungen haben, bei denen Average_Pulse oder Calorie_Burnage gleich Null sind. 80 ist die erste Beobachtung von Average_Pulse und 240 ist die erste Beobachtung von Calorie_Burnage.
Schau dir die Linie an. Was passiert mit dem Kalorienverbrauch, wenn der durchschnittliche Puls von 80 auf 90 steigt?
Wir können die diagonale Linie verwenden, um die mathematische Funktion zur Vorhersage des Kalorienverbrauchs zu finden.
Wie sich herausstellt:
- Liegt der durchschnittliche Puls bei 80, liegt der Kalorienverbrauch bei 240
- Liegt der durchschnittliche Puls bei 90, liegt der Kalorienverbrauch bei 260
- Liegt der durchschnittliche Puls bei 100, liegt der Kalorienverbrauch bei 280
Es gibt ein Muster. Steigt der durchschnittliche Puls um 10, steigt der Kalorienverbrauch um 20.