Data Science - Steigung und Schnittpunkt


Steigung und Schnittpunkt

Jetzt erklären wir, wie wir die Steigung und den Achsenabschnitt unserer Funktion gefunden haben:

f(x) = 2x + 80

Das Bild unten zeigt auf die Steigung – die angibt, wie steil die Linie ist, und den Schnittpunkt – der der Wert von y ist, wenn x = 0 ist (der Punkt, an dem die diagonale Linie die vertikale Achse kreuzt). Die rote Linie ist die Fortsetzung der blauen Linie von der vorherigen Seite.

Lineare Funktion

Finden Sie die Steigung

Die Steigung ist definiert als wie viel Kalorien verbrannt werden, wenn der durchschnittliche Puls um eins steigt. Sie sagt uns, wie „steil“ die Diagonale ist.

Wir können die Steigung finden, indem wir die proportionale Differenz von zwei Punkten aus dem Diagramm verwenden.

  • Liegt der durchschnittliche Puls bei 80, liegt der Kalorienverbrauch bei 240
  • Liegt der durchschnittliche Puls bei 90, liegt der Kalorienverbrauch bei 260

Wir sehen, dass wenn der durchschnittliche Puls um 10 steigt, der Kalorienverbrauch um 20 steigt.

Slope = 20/10 = 2

Die Steigung beträgt 2.

Mathematisch ist Steigung definiert als:

Slope = f(x2) - f(x1) / x2-x1

f(x2) = Zweite Beobachtung von Calorie_Burnage = 260
f(x1) = Erste Beobachtung von Calorie_Burnage = 240
x2 = Zweite Beobachtung von Average_Pulse = 90
x1 = Erste Beobachtung von Average_Pulse = 80

Slope = (260-240) / (90 - 80) = 2

Seien Sie konsequent, um die Beobachtungen in der richtigen Reihenfolge zu definieren! Wenn nicht, wird die Vorhersage nicht korrekt sein!

Verwenden Sie Python, um die Steigung zu finden

Berechnen Sie die Steigung mit dem folgenden Code:

Beispiel

def slope(x1, y1, x2, y2):
  s = (y2-y1)/(x2-x1)
  return s

print (slope(80,240,90,260))

Finden Sie den Abschnitt

Der Schnittpunkt wird verwendet, um die Funktionsfähigkeit zur Vorhersage von Calorie_Burnage zu optimieren.

Der Schnittpunkt ist dort, wo die diagonale Linie die y-Achse schneidet, wenn sie vollständig gezeichnet wäre.

Der Schnittpunkt ist der Wert von y, wenn x = 0 ist.

Hier sehen wir, dass wenn der durchschnittliche Puls (x) Null ist, der Kalorienverbrauch (y) 80 beträgt.

Der Schnittpunkt ist also 80.

Manchmal hat der Abschnitt eine praktische Bedeutung. Manchmal nicht.

Macht es Sinn, dass der durchschnittliche Puls Null ist?

Nein, du wärst tot und du würdest sicherlich keine Kalorien verbrennen.

Wir müssen jedoch den Schnittpunkt einbeziehen, um die Fähigkeit der mathematischen Funktion zur korrekten Vorhersage von Calorie_Burnage zu vervollständigen.

Weitere Beispiele, bei denen der Schnittpunkt einer mathematischen Funktion eine praktische Bedeutung haben kann:

  • Vorhersage des Umsatzes für das nächste Jahr anhand der Marketingausgaben (Wie viel Umsatz werden wir im nächsten Jahr haben, wenn die Marketingausgaben null sind?). Es ist davon auszugehen, dass ein Unternehmen auch dann noch Einnahmen erzielt, wenn es kein Geld für Marketing ausgibt.
  • Kraftstoffverbrauch mit Geschwindigkeit (Wie viel Kraftstoff verbrauchen wir, wenn die Geschwindigkeit gleich 0 km/h ist?). Ein Auto, das Benzin verwendet, verbraucht auch im Leerlauf Kraftstoff.


Finden Sie die Steigung und den Schnittpunkt mit Python

Die np.polyfit()Funktion gibt die Steigung und den Achsenabschnitt zurück.

Wenn wir mit dem folgenden Code fortfahren, können wir sowohl die Steigung als auch den Achsenabschnitt aus der Funktion erhalten.

Beispiel

import pandas as pd
import numpy as np

health_data = pd.read_csv("data.csv", header=0, sep=",")

x = health_data["Average_Pulse"]
y = health_data["Calorie_Burnage"]
slope_intercept = np.polyfit(x,y,1)

print(slope_intercept)

Beispiel erklärt:

  • Isolieren Sie die Variablen Average_Pulse (x) und Calorie_Burnage (y) aus health_data.
  • Rufen Sie die Funktion np.polyfit() auf.
  • Der letzte Parameter der Funktion gibt den Grad der Funktion an, der in diesem Fall "1" ist.

Tipp: lineare Funktionen = 1°-Funktion. In unserem Beispiel ist die Funktion linear, was im 1°-Bereich liegt. Das bedeutet, dass alle Koeffizienten (die Zahlen) in der Potenz von Eins stehen.

Wir haben nun die Steigung (2) und den Achsenabschnitt (80) berechnet. Wir können die mathematische Funktion wie folgt schreiben:

Prognostizieren Sie Calorie_Burnage mithilfe eines mathematischen Ausdrucks:

f(x) = 2x + 80

Aufgabe:

Nun wollen wir den Kalorienverbrauch vorhersagen, wenn der durchschnittliche Puls 135 beträgt.

Denken Sie daran, dass der Schnittpunkt eine Konstante ist. Eine Konstante ist eine Zahl, die sich nicht ändert.

Wir können jetzt die Eingabe x durch 135 ersetzen:

f(135) = 2 * 135 + 80 = 350

Wenn der durchschnittliche Puls 135 beträgt, beträgt der Kalorienverbrauch 350.


Definieren Sie die mathematische Funktion in Python

Hier ist genau die gleiche mathematische Funktion, aber in Python. Die Funktion gibt 2*x + 80 zurück, mit x als Eingabe:

Beispiel

def my_function(x):
  return 2*x + 80

print (my_function(135))

Versuchen Sie, x durch 140 und 150 zu ersetzen.


Zeichnen Sie einen neuen Graphen in Python

Hier zeichnen wir den gleichen Graphen wie zuvor, haben aber die Achse ein wenig formatiert.

Der maximale Wert der y-Achse beträgt jetzt 400 und für die x-Achse 150:

Beispiel

import matplotlib.pyplot as plt

health_data.plot(x ='Average_Pulse', y='Calorie_Burnage', kind='line'),
plt.ylim(ymin=0, ymax=400)
plt.xlim(xmin=0, xmax=150)

plt.show()

Beispiel erklärt

  • Importieren Sie das Pyplot-Modul der Matplotlib-Bibliothek
  • Zeichnen Sie die Daten von Average_Pulse gegen Calorie_Burnage
  • kind='line'sagt uns, welche Art von Handlung wir wollen. Hier wollen wir eine gerade Linie haben
  • plt.ylim() und plt.xlim() sagen uns, auf welchem ​​Wert die Achse starten und stoppen soll.
  • plt.show() zeigt uns die Ausgabe