Python 中的 NumPy .直方图()方法
直方图是可视化数据集频率分布的最佳方式,它将数据集分割成大小相等的小区间,称为面元。Numpy 直方图函数类似于 matplotlib 库的 hist()函数,唯一的区别是 Numpy 直方图给出数据集的数字表示,而 hist()给出数据集的图形表示。
创建数值直方图
Numpy 有一个内置的 numpy .直方图()函数,它以图形形式表示数据分布的频率。具有相等水平尺寸的矩形对应于称为箱的类间隔,而可变高度对应于频率。 语法:
直方图(数据,箱=10,范围=无,赋范=无,权重=无,密度=无)
上述功能的属性如下:
该函数有两个返回值 hist ,给出直方图的值数组,以及 edge_bin ,这是一个浮点数据类型数组,包含长度比 hist 多一个的 bin 边。 例:
蟒蛇 3
# Import libraries
import numpy as np
# Creating dataset
a = np.random.randint(100, size =(50))
# Creating histogram
np.histogram(a, bins = [0, 10, 20, 30, 40,
50, 60, 70, 80, 90,
100])
hist, bins = np.histogram(a, bins = [0, 10,
20, 30,
40, 50,
60, 70,
80, 90,
100])
# printing histogram
print()
print (hist)
print (bins)
print()
输出:
图示
上述直方图的数字表示可以转换成图形形式。Matplotlib py plot 子模块中的 plt()函数以数据集数组和 bin 数组为参数,创建相应数据值的直方图。 例:
蟒蛇 3
# import libraries
from matplotlib import pyplot as plt
import numpy as np
# Creating dataset
a = np.random.randint(100, size =(50))
# Creating plot
fig = plt.figure(figsize =(10, 7))
plt.hist(a, bins = [0, 10, 20, 30,
40, 50, 60, 70,
80, 90, 100])
plt.title("Numpy Histogram")
# show plot
plt.show()
输出: