4. numpy简介
bash
https://gitee.com/fakerlove/python
1. 简介
1.1 安装
python
pip install numpy pandas
或者
python
pip3 install numpy pandas
1.2 创建各种各样的数组
python
import numpy as np
import matplotlib.pyplot as plt
print(np.zeros(10)) #一维全零数组
print(np.zeros((3,3),dtype=np.int)) #多维tupple数组 3行3列 可以加数据类型
print(np.ones(10)) #一维全1数组
print(np.ones((4,4))) #多维全1数组
print(np.full((3,5),8)) #可以指定数组元素的值
print(np.identity(4)) #创建单位矩阵
print(np.eye(4,4,1)) #4行4列单位矩阵 对角线从下标1开始
print(np.array([1,23,4,'ltf','fjf'])) #可以随便传入数据 一维数组
print(np.array([[1,2,3],['ltf','lsq','fjf'],['男','女','人妖']])) #多维数组,随便定义、
a=np.array([[1,2,3],[4,3,6]])
b=np.full_like(a,3.2)
c=np.ones_like(a)
print(b)
print(c)
#根据一个向量创建斜对角线方阵 也可以指定对角线位置
arr2d=np.diag([1,2,3,4])
print(arr2d)
print(np.arange(1,6)) #类似于range 不包含上界
print(np.arange(1,10,2)) #开始 结束 步长
print(np.linspace(1,10,4)) #开始 结束 个数
print(np.logspace(1,4,4)) #分为4个等分点,形成数组【1,2,3,4】然后形成 对数的底数的指数
print(np.logspace(1,5,5,base=2)) #指定对数为2
#创建坐标系 其实可以用plt.show()
x=np.linspace(0,1,5)
y=np.linspace(0,1,3)
xv,yv=np.meshgrid(x,y)
print(xv)
print(yv)
plt.plot(xv,yv,'^')
plt.show()
#指数图
x=np.arange(-5,5,0.1)
y=np.power(2,x)
#print(y)
plt.plot(x,y)
#对数图
x=np.power(2,x)
y=np.log2(x)
plt.plot(x,y)
plt.show()
x1=np.arange(1,5,1)
y1=np.power(x1,3) #x1的3次方
print(y1)
x2=np.array([1,8,27,64])
y2=np.power(x2,1/3) #x2的1/3次方
print(y2)
1.3 数组的复制等各种操作
python
import numpy as np
#1 赋值 改变原数组
a=np.array([1,2,3,4,5])
b=a
b[0]=100
print(b)
print(a)
#2 拷贝 不改变原数组
a1=np.array([1,2,3,4,5])
b1=np.copy(a1)
b1[0]=20
print(a1)
print(b1)
#3 修改
arry=np.array([1,2,3,4,5])
#arry[2]=10
arry[0:2]=8 #包头不包尾
print(arry)
arr1=np.array([[1,2,3,4],[5,6,7,8]])
print(arr1.T) #数组的转置
arr1.shape=4,2
print(arr1) #简单分隔
#4 分隔
arr2=np.arange(0,20,1)
print(arr2.reshape(4,5))
newarr2=arr2.reshape(4,5)
newarr2[0:2,0]=8 #0行1行 的0列 为8
print(newarr2)
#5
newarr3=np.reshape(newarr2,(1,-1)) #行数为1, 列数 待定
print(newarr3)
newarr4=np.reshape(newarr2,(-1,1)) #列数为1, 行数 待定
print(newarr4)
newarr5=newarr3[0][:,np.newaxis] #取第一行 即一维数组 在变成一列
print(newarr5)
#6 二维数组转一维数组
arr2d=np.arange(1,21,1).reshape(4,5) #4行5列
print(arr2d)
arr2d1=np.ravel(arr2d)
print(arr2d1) #arr2d1和arr2d共享同一块内存
print(arr2d.flatten()) #不共享内存
#7 resize使用
arrresize=np.resize(arr2d,(5,2)) #5行2列 本来有20个元素 只取其中的10个也可以 不像reshape必须全取
print(arrresize)
#8 转置 多维转换置换
arr3d=np.arange(1,28,1).reshape(3,3,3)
print(arr3d)
arr3d1=np.transpose(arr3d)
print(arr3d1)
1.4 数组的修改等各种操作
python
import numpy as np
#1.访问二维数组
a=np.arange(1,16,1).reshape(3,5) #3行5列数组
print(a)
print(a[1]) #访问第一行
print(a[1,1]) #访问第一行第一列的元素
print(a[1][1]) #访问第一行第一列的元素
#2.访问二维数组部分元素
print('-'*20)
b=np.arange(1,16,1).reshape(3,5) #3行5列二维数组
print(b)
print(b[0:1,2:4]) #第一行下标为2和下标为3的元素
print(b[:,3]) #所有行下标为3的列数的所有元素
print(b[:,2:5]) #所有行,2,3,4列元素
#3.删除元素
print('-'*20)
c=np.arange(1,16,1).reshape(3,5) #3行5列二维数组
print(c)
print(np.delete(c,1)) #删除行号 返回一位数组
print(np.delete(c,[2,3,8,9])) #返回一位数组 删除下标为2,3,8,9的元素
#4.删除列元素
print('-'*20)
d=np.arange(1,16,1).reshape(3,5) #3行5列二维数组
print(d)
print(np.delete(d,1,axis=0)) #删除下标为1这一行
print(np.delete(d,[2,3],axis=1)) #删除下标为2和3 的这两列
#5.插入元素
print('-'*20)
e=np.array([[1,2],[3,4],[5,6]])
print(e)
print(np.insert(e,1,5)) #返回一维数组 把5插入到1号索引后
print(np.insert(e,1,5,axis=1)) #插入一列 该列元素全为5
print(np.insert(e,1,[0,2,5],axis=1)) #插入一列 为0,2,5
print(np.insert(e,len(e),[[7,8]],axis=0)) #在最后一列插入一行
print(np.c_[e,np.array([1,1,1])]) #在最后一行后面加一列
print(np.append(e,[[7,8]],axis=0)) #append追加一列
1.5 数组的组合拼接等等
python
import numpy as np
#1.数组的行拼接
a=np.array([[1,2],[3,4]])
b=np.array([[5,6]])
c=np.concatenate((a,b),axis=0) #axis=0 按行
d=np.vstack((a,b)) #行 方法
print(c)
print(d)
#2.数组的列拼接
a=np.array([[1,2],[3,4]])
b=np.array([[5],[6]])
c=np.concatenate((a,b),axis=1) #axis=1 按列 要求具有同样的列数
d=np.hstack((a,b)) #列方法
print(c)
print(d)
#3.竖直方向将二维数组拆分成若干个数组
a=np.arange(1,21,1).reshape(4,5)
b=np.split(a,2)
c=np.vsplit(a,2)
print(b)
print(c)
#4.水平方向将二维数组拆分成若干个数组
a=np.arange(1,21,1).reshape(4,5)
b=np.hsplit(a,5)
print(b)
1.6 数组的查找,排序,统计
python
import numpy as np
#1.检查符合条件的元素
a=np.array([1,0,0,3,4,5,0,8])
b=np.nonzero(a)
print(b) #不为0的下标
c=a[b]
print(c) #输出不为0的元素 1,3,4,5,8
#2.二维数组查找
a=np.array([[1,2,0],[4,0,6],[0,8,9]])
b=np.nonzero(a)
c=a[b]
print(c) #输出一维数组1,2,4,6,8,9
#3.查找指定条件
a=np.arange(10)
print(a)
b=np.where(a>5)
print(a[b]) #查找大于5的
#4.返回条件为true
a=np.arange(5)
b=np.array([True,False,True,True,False])
print(a[b]) #输出0,2,3
print(b[a])
#5.返回指定索引的若干个元素
a=np.array([4,3,5,7,6,8])
b=np.take(a,[0,1,4]) #返回索引为0,1,4的元素
print(b)
#5.数组排序
a=np.arange(5)
print(a[::-1]) #倒序,,-1指定步长为-1 倒数
b=np.array([3,4,1,8,4,9,5,6,9])
print(np.sort(b)) #一维数组排序
a=np.array([[3,1,5],[2,4,0]])
print(a)
b=np.sort(a,axis=0) #沿着行索引增加方向排序,也就是对每一列排序
print(b)
c=np.sort(a,axis=1) #沿着列索引增加方向排序,也就是对每一行排序
print(c)
#5.分界线排序
a=np.array([30,20,40,50,10,80,50,40,90,76])
b=np.partition(a,0)
print(b) #小于30的在左边 大于30的在右边 等于也在右边
c=np.partition(a,6)
print(c) #小于50的在左边 大于50的在右边 等于也在右边
#6.数组统计
a=np.array([1,3,6,2,5,9,8,10,4])
print(a.max()) #最大值
print(np.max(a)) #最大值
print(np.min(a)) #最小值
a=np.arange(1,11,1).reshape(2,5) #2行5列2维数组
print(a)
print(np.max(a)) #所有元素里面的最大值
print(np.max(a,axis=0)) #行索引 找出每一列的最大值
print(np.max(a,axis=1)) #列索引 找出每一行的最大值
a=np.array([[1,3,9],[2,5,4],[6,7,8]])
print('-'*20)
print(np.max(a,axis=0)) #行索引 找出每一列的最大值
print(np.max(a,axis=1)) #列索引 找出每一行的最大值
#查找极值元素的索引
a=np.array([1,2,0,4,5,3,7,9])
print(np.argmax(a)) #索引号 7
print(np.argmin(a)) #索引号 2
a=np.array([[1,2,3],[6,5,4],[9,7,8]]) #3行3列
print(a)
print(np.argmax(a))
print(np.argmax(a,axis=0)) #每一列最大元素的索引
print(np.argmax(a,axis=1)) #每一行最大元素的索引
#计算数组平均值
a=np.arange(1,13,1).reshape(3,4)
print(a)
print(np.mean(a)) #输出 所有数的和的平均值
print(np.mean(a,axis=0)) #每一列的平均值
print(np.mean(a,axis=1)) #每一行的平均值
#计算数组加权平均值
a=np.arange(1,11)
print(a) #输出1-11的十个数
print(np.mean(a)) #没加权重
b=np.average(a,weights=np.array([1,3,1,0,0,1,1,0,1,2])) #这是加了权重
print(b)
2. numpy
2.1 基本属性
python
import numpy as np
array=[[1,2,3],[4,5,6]]
arr=np.array(array)
# 打印矩阵
print(arr)
# 维度 --二维矩阵
print(arr.ndim)
# 矩阵的维度
print(arr.shape)
# 矩阵元素的个数
print(arr.size)
python
import numpy as np
# 一维
arr1=np.array([1,3,4])
print(arr1)
# 定义一个二维
array=[[1,2,3],[4,5,6]]
# 这边类型有int16,int32,int64,float32,float64
arr=np.array(array,dtype=np.float64)
print(arr.dtype)
# 定义一个全部为0 的数组
a=np.zeros(5)
print("定义一个全部为0 的数组",a)
# 定义一个二维矩阵
a=np.zeros((2,4),dtype=np.int64)
print(a)
# 定义一个三维举证
a=np.zeros((2,4,1),dtype=np.int32)
print(a)
# 定义全为1的
a=np.ones(3)
print("定义全为1的",a)
a=np.empty(3)
print("生成空的矩阵",a)
a=np.arange(3)
print(a)
# 生成3*4 的二维矩阵
a=np.arange(12).reshape(3,4)
print("生成3*4 的二维矩阵",a)
2.2 基础运算
一维
python
import numpy as np
a=np.array([10,20,30,40])
b=np.arange(4)
print(a,b)
# 加法运算
c=a+b
print(c)
# 平方
c=b**2
print(c)
# 平方,一样的效果
c=b*b
print(c)
# 对每个元素进行tan
print(np.tan(a))
# 对每个元素进行比较
print(a<30)
print(a==30)
二维
python
import numpy as np
a=np.array([[1,2],[3,4]])
b=np.arange(4).reshape((2,2))
c=np.arange(4).reshape((2,2))
print(a)
print(b)
# 每个元素自己相乘
print(a*b)
# 矩阵相乘
c_dot=np.dot(a,b)
print(c_dot)
# 矩阵相乘的另一种写法
print(a.dot(b))
# 随机生成一个矩阵
a=np.random.random((2,4))
print(a)
print("所有元素求和",np.sum(c_dot))
print("所有元素的最小值",np.min(c_dot))
# 1 表示行,0 表示列
print("每一行的最小值",np.min(c_dot,axis=1))
print("每一列的最小值",np.min(c_dot,axis=0))
print("所有元素的最大值",np.max(c_dot))
print("所有元素求和",np.sum(c_dot,axis=1))
python
import numpy as np
A=np.arange(2,14).reshape((3,4))
print(A)
# 最小值的索引值
print(np.argmin(A))
# 最大值的索引值
print(np.argmax(A))
# 所有值的平均值
print(np.mean(A))
# 所有值的平均值
print(np.average(A))
# 逐渐累加的过程
print(np.cumsum(A))
# 中位数
print(np.median(A))
# 累差,每两个数之间的差
print(np.diff(A))
#逐行进行排序
A_1=np.arange(14,2,-1).reshape((3,4))
print(A_1)
print(np.sort(A_1))
# 矩阵的转置
print(np.transpose(A))
# 截取矩阵
print(np.clip(A,5,9))
# 平均值
print(np.mean(A,axis=0))
# 对行进行平均值
print(np.mean(A,axis=1))
2.3 索引
python
import numpy as np
A=np.arange(3,15).reshape(3,4)
print(A)
print("打印的是一行",A[2])
print("打印一个数字",A[1][1])
print("打印一个数字",A[2,1])
print("打印范围",A[2,1:3])
# 打印列
for column in A.T:
print(column)
# 返回一个array
print(A.flatten())
# 打印所有数字
for item in A.flat:
print(item)
2.4 array 合并
- np.append()
- np.concatenate()
- np.stack()
- np.hstack()
- np.vstack()
- np.dstack()
其中最泛用的是第一个和第二个。第一个可读性好,比较灵活,但是占内存大。第二个则没有内存占用大的问题。
parameters | introduction |
---|---|
arr | 待合并的数组的复制(特别主页是复制,所以要多耗费很多内存) |
values | 用来合并到上述数组复制的值。如果指定了下面的参数axis 的话,则这些值必须和arr 的shape一致(shape[axis]之外都相等),否则的话,则没有要求。 |
axis | 要合并的轴 |
python
import numpy as np
A=np.array([1,1,1])
B=np.array([2,2,2])
C=np.vstack((A,B))
# 1 为列进行合并
D=np.append([[1,2,3]],[[3,4,54]],axis=1)
# 左右合并
F=np.hstack((A,B))
# 垂直合并
print(C)
print(A.shape)
print(D)
print(F)
# 实现变成数列的
print(A[:,np.newaxis])
print(np.vstack(A))
print(np.concatenate((A,B,A,B),axis=0))
concatenate
parameters | introduction |
---|---|
*arrays | 这些数组除了在待合并的axis(默认为axis=0)上之外,必须具有相同的shape |
axis | 待合并的轴,默认为0 |
2.5 array 分割
python
import numpy as np
A=np.arange(12).reshape((3,4))
print(A)
# 分成两列
print(np.split(A,2,axis=1))
# 分成三列
print(np.split(A,[1,1,2],axis=1))
# 水平分割
print(np.hsplit(A,2))
# 垂直分割
print(np.vsplit(A,3))
a = np.arange(24).reshape(2,3,4)
print(a)
#深度分割
print(np.dsplit(a,2))
2.6 拷贝
python
import numpy as np
a=np.arange(4,dtype=float)
print(a)
# 浅拷贝,当原来的array 修改时,b 也跟着修改
b=a
print(b is a)
a[0]=0.3
print(a)
print(b)
# 深度拷贝
b=a.copy()
a[0]=0.55
print(a)
print(b)
b[0]=12
print(a)
print(b)