Data Science - Lineare Funktionen


Als Data Scientist ist es wichtig, mathematische Funktionen zu kennen, denn wir wollen Vorhersagen treffen und interpretieren.


Lineare Funktionen

In der Mathematik wird eine Funktion verwendet, um eine Variable mit einer anderen Variablen in Beziehung zu setzen.

Angenommen, wir betrachten die Beziehung zwischen Kalorienverbrauch und durchschnittlichem Puls. Es ist vernünftig anzunehmen, dass sich der Kalorienverbrauch im Allgemeinen ändert, wenn sich der durchschnittliche Puls ändert – wir sagen, dass der Kalorienverbrauch vom durchschnittlichen Puls abhängt.

Darüber hinaus kann die Annahme vernünftig sein, dass mit zunehmendem durchschnittlichen Puls auch die Kalorienverbrennung zunimmt. Kalorienverbrauch und durchschnittlicher Puls sind die beiden Variablen, die betrachtet werden.

Da der Kalorienverbrauch vom durchschnittlichen Puls abhängt, sagen wir, dass der Kalorienverbrauch die abhängige Variable und der durchschnittliche Puls die unabhängige Variable ist.

Der Zusammenhang zwischen einer abhängigen und einer unabhängigen Variablen lässt sich oft mathematisch mit einer Formel (Funktion) ausdrücken.

Eine lineare Funktion hat eine unabhängige Variable (x) und eine abhängige Variable (y) und hat die folgende Form:

y = f(x) = ax + b

Diese Funktion wird verwendet, um einen Wert für die abhängige Variable zu berechnen, wenn wir einen Wert für die unabhängige Variable auswählen.

Erläuterung:

  • f(x) = die Ausgabe (die abhängige Variable)
  • x = die Eingabe (die unabhängige Variable)
  • a = Steigung = ist der Koeffizient der unabhängigen Variablen. Sie gibt die Änderungsrate der abhängigen Variablen an
  • b = Schnittpunkt = ist der Wert der abhängigen Variablen, wenn x = 0. Es ist auch der Punkt, an dem die diagonale Linie die vertikale Achse schneidet.


Lineare Funktion mit einer erklärenden Variablen

Eine Funktion mit einer erklärenden Variablen bedeutet, dass wir eine Variable zur Vorhersage verwenden.

Nehmen wir an, wir wollen den Kalorienverbrauch anhand des durchschnittlichen Pulses vorhersagen. Wir haben folgende Formel:  

f(x) = 2x + 80

Hier bedeuten die Zahlen und Variablen:

  • f(x) = Die Ausgabe. An dieser Zahl erhalten wir den vorhergesagten Wert von Calorie_Burnage
  • x = Die Eingabe, die Average_Pulse ist
  • 2 = Slope = Gibt an, um wie viel Calorie_Burnage steigt, wenn Average_Pulse um eins steigt. Sie sagt uns, wie „steil“ die Diagonale ist
  • 80 = Intercept = Ein fester Wert. Es ist der Wert der abhängigen Variablen, wenn x = 0 ist

Zeichnen einer linearen Funktion

Der Begriff Linearität bedeutet eine „Gerade“. Wenn Sie also eine lineare Funktion grafisch darstellen, ist die Linie immer eine gerade Linie. Die Linie kann nach oben oder unten geneigt sein und kann in einigen Fällen horizontal oder vertikal sein.

Hier ist eine grafische Darstellung der obigen mathematischen Funktion:

Lineare Funktion

Erläuterungen zu den Grafiken:

  • Die horizontale Achse wird allgemein als x-Achse bezeichnet. Hier repräsentiert es Average_Pulse.
  • Die vertikale Achse wird allgemein als y-Achse bezeichnet. Hier repräsentiert es Calorie_Burnage.
  • Calorie_Burnage ist eine Funktion von Average_Pulse, da angenommen wird, dass Calorie_Burnage von Average_Pulse abhängt.
  • Mit anderen Worten, wir verwenden Average_Pulse, um Calorie_Burnage vorherzusagen.
  • Die blaue (diagonale) Linie stellt die Struktur der mathematischen Funktion dar, die den Kalorienverbrauch vorhersagt.