Zipf-Verteilung


Zipf-Distributionen werden verwendet, um Daten auf der Grundlage des Zipf-Gesetzes abzutasten.

Zipfsches Gesetz: In einer Sammlung ist der n-te gemeinsame Term das 1/n-fache des häufigsten Terms. Das 5. gebräuchliche Wort im Englischen kommt zum Beispiel fast 1/5 mal vor wie das am häufigsten verwendete Wort.

Es hat zwei Parameter:

a - Verteilungsparameter.

size - Die Form des zurückgegebenen Arrays.

Beispiel

Zeichnen Sie ein Beispiel für die Zipf-Verteilung mit Verteilungsparameter 2 mit der Größe 2x3:

from numpy import random

x = random.zipf(a=2, size=(2, 3))

print(x)

Visualisierung der Zipf-Verteilung

Nehmen Sie 1000 Punkte auf, zeichnen Sie jedoch nur Punkte mit einem Wert < 10, um ein aussagekräftigeres Diagramm zu erhalten.

Beispiel

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)

plt.show()

Ergebnis