Zipf-Verteilung
Zipf-Distributionen werden verwendet, um Daten auf der Grundlage des Zipf-Gesetzes abzutasten.
Zipfsches Gesetz: In einer Sammlung ist der n-te gemeinsame Term das 1/n-fache des häufigsten Terms. Das 5. gebräuchliche Wort im Englischen kommt zum Beispiel fast 1/5 mal vor wie das am häufigsten verwendete Wort.
Es hat zwei Parameter:
a
- Verteilungsparameter.
size
- Die Form des zurückgegebenen Arrays.
Beispiel
Zeichnen Sie ein Beispiel für die Zipf-Verteilung mit Verteilungsparameter 2 mit der Größe 2x3:
from numpy import random
x = random.zipf(a=2, size=(2, 3))
print(x)
Visualisierung der Zipf-Verteilung
Nehmen Sie 1000 Punkte auf, zeichnen Sie jedoch nur Punkte mit einem Wert < 10, um ein aussagekräftigeres Diagramm zu erhalten.
Beispiel
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()