Python科学计算包NumPy
在机器学习过程中设计很多线性代数知识,因此会经常使用NumPy函数库。Numpy可以在不同的数据点上执行矩阵形式的数学运算而不需要复杂的循环操作。
对于初学者,在安装python以及numpy,由于操作不慎会遇到各种细节问题,因此对于新手来说推荐使用Anaconda工具。
Anaconda
Anaconda是一个用于科学计算的python发行版,支持Linux、Mac、Windows,包含了众多流行的科学计算、数据分析的python包。 —— [ Anaconda下载 ]
Anaconda的优势
- 不需要配置python环境变量
- 集成许多package,免去下载的麻烦
- package的安装简单,用conda安装
- 可以配置python3版本的环境,方便切换
NumPy包下的所有函数的官方文档
机器学习过程中numpy包中常见函数总结
函数 | 解释 |
sum(self, axis=None, dtype=None, out=None, keepdims=) | 返回给定轴上的数组元素的总和 |
mean(self, axis=None, dtype=None, out=None, keepdims=) | 返回沿给定轴的数组元素的平均值 |
std(a, axis=None, dtype=None, out=None, ddof=0, keepdims=) | 返回数组元素的标准偏差,即分布的扩展的度量。默认情况下为平展数组计算标准偏差,否则在指定轴上计算 |
var(a, axis=None, dtype=None, out=None, ddof=0, keepdims=) | 返回数组元素的方差,即分布的扩展的度量。默认情况下为平展数组计算方差,否则在指定轴上计算 |
min(obj, axis=None, out=None, fill_value=None, keepdims=) | 沿给定轴返回最小值 |
max(obj, axis=None, out=None, fill_value=None, keepdims=) | 沿给定轴返回最大值 |
ptp(a, axis=None, out=None) | 沿轴的值范围(最大 - 最小)。函数的名称来自“峰到峰”的首字母缩写。 |
argmax(a, axis=None, out=None) | 返回沿轴的最大值的索引 |
argmin(a, axis=None, out=None) | 返回沿轴的最小值的索引 |
median(a, axis=None, out=None, overwrite_input=False, keepdims=False) | 返回数组元素的中值 |
dot(a, b, out=None) | 两个数组的点积。对于2-D阵列,其等效于矩阵乘法,并且对于1-D阵列到向量的内积(无复共轭) |
zeros(shape, dtype=None, order=’C’) | 依据给定形状和类型返回一个新的元素全部为0的数组 |
shape(obj) | 返回数组的形状 |
ones(shape, dtype=None, order=’C’) | 依据给定形状和类型返回一个新的元素全部为1的数组 |
transpose(a, axes=None) | 转置矩阵 |
linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None) | 返回num均匀间隔的样本,在间隔[ 开始,停止 ]上计算 |
random.random(size=None) | 在半开间隔[0.0,1.0]中返回随机浮点数 |
random.seed(seed=None) | 种子生成器 |
PS:后续更新。