为什么numpy的array那么快?_深圳千锋IT培训

千锋教育-做有情怀、有良心、有品质的职业教育机构

400-811-9990

手机站

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站

领取全套视频

千锋教育

关注千锋学习站小程序
随时随地免费学习课程

首页课程

HTML5

Java

Python

云计算

软件测试

网络安全

大数据

物联网

Unity

UI/UE设计

全媒体营销

影视剪辑

游戏原画

区块链

产品经理

商业插画

PMP认证

红帽RHCE

软考认证

华为认证

教程
HTML5视频教程 Java视频教程 Python视频教程 UI视频教程云计算视频教程软件测试视频教程大数据视频教程物联网视频教程 Unity视频教程网络安全视频教程全媒体视频教程影视剪辑视频教程
教研
教研院师资团队项目大赛
服务
企业内训高校合作学科共建
就业
就业服务双选会上门招聘人才定制
问答资讯技术干货 IT培训机构零基础学IT 关于千锋
千锋简介联系我们锋益公益大赛组织品牌活动

上海

北京
郑州
武汉
成都
西安
沈阳

广州
南京
深圳
大连
青岛
杭州
重庆

当前位置：深圳千锋IT培训 > 技术干货 > 为什么numpy的array那么快?

为什么numpy的array那么快?

来源：千锋教育

发布人：xqq

时间： 2023-10-20 13:47:08

一、为什么numpy的array那么快

NumPy的数组是一种静态、同质的类型，当ndarray对象被创建时，元素的类型就确定。

由于是静态类型，所以 ndarray 间的加、减、乘、除用C和Fortran实现才成为可能，所以运行起来就会更快。numpy官网介绍，numpy的底层代码用C语言和Fortran语言实现，实现性能无限接近C的处理效率，C语言的执行效率本身就比python的执行效率高，所以numpy数组的计算速度比python原生的list序列快

理解ndarray

NumPy ndarray是一个N维数组。您可以如此创建：

X = np.array([[0,1,2],[3,4,5]], dtype=’int16′)

这些数组存储着相同大小的元素的同质数组。也就是说，数组中的所有项都具有相同的数据类型且大小相同。例如，您不能在同一个ndarray中放入字符串’hello’和整数16。

Ndarrays有两个关键特征：shape和dtype。

shape描述了数组的每个维度的长度，即将数组计为一个元素的情况下，在该维度中的元素计数。例如，上面的阵列X具有形状（2,3）。我们可以像这样想象它：

NP.ARRAY([[0,1,2],[3,4,5]])

dtype（数据类型）定义元素大小。例如，每个int16项的大小为16位，即16/8 = 2个字节。（一个字节等于8位。）因此X.itemsize为2。具体的dtype是可选的。

延伸阅读：

二、umpy数组相对于List的优势

1.内存占用更小

适当地使用Numpy数组替代List，你能让你的内存占用降低20倍。

对于Python原生的List列表，由于每次新增对象，都需要8个字节来引用新对象，新的对象本身占28个字节（以整数为例）。所以列表 list 的大小可以用以下公式计算：

64 + 8 * len(lst) + len(lst) * 28 字节

而使用Numpy，就能减少非常多的空间占用。比如长度为n的Numpy整形Array，它需要：

96 + len(a) * 8 字节

可见，数组越大，你节省的内存空间越多。假设你的数组有10亿个元素，那么这个内存占用大小的差距会是GB级别的。

2.速度更快、内置计算方法

运行下面这个脚本，同样是生成某个维度的两个数组并相加，你就能看到原生List和Numpy Array的性能差距。

import time

import numpy as np

size_of_vec = 1000

def pure_python_version():

t1 = time.time()

X = range(size_of_vec)

Y = range(size_of_vec)

Z = [X[i] + Y[i] for i in range(len(X)) ]

return time.time() – t1

def numpy_version():

t1 = time.time()

X = np.arange(size_of_vec)

Y = np.arange(size_of_vec)

Z = X + Y

return time.time() – t1

t1 = pure_python_version()

t2 = numpy_version()

print(t1, t2)

print(“Numpy is in this example ” + str(t1/t2) + ” faster!”)

结果如下：

0.00048732757568359375 0.0002491474151611328

Numpy is in this example 1.955980861244019 faster!

可以看到，Numpy比原生数组快1.95倍。

如果你细心的话，还能发现，Numpy array可以直接执行加法操作。而原生的数组是做不到这点的，这就是Numpy 运算方法的优势。

我们再做几次重复试验，以证明这个性能优势是持久性的。

import numpy as np

from timeit import Timer

size_of_vec = 1000

X_list = range(size_of_vec)

Y_list = range(size_of_vec)

X = np.arange(size_of_vec)

Y = np.arange(size_of_vec)

def pure_python_version():

Z = [X_list[i] + Y_list[i] for i in range(len(X_list)) ]

def numpy_version():

Z = X + Y

timer_obj1 = Timer(“pure_python_version()”,

“from __main__ import pure_python_version”)

timer_obj2 = Timer(“numpy_version()”,

“from __main__ import numpy_version”)

print(timer_obj1.timeit(10))

print(timer_obj2.timeit(10)) # Runs Faster!

print(timer_obj1.repeat(repeat=3, number=10))

print(timer_obj2.repeat(repeat=3, number=10)) # repeat to prove it!

结果如下：

0.0029753120616078377

0.00014940369874238968

[0.002683573868125677, 0.002754641231149435, 0.002803879790008068]

[6.536301225423813e-05, 2.9387418180704117e-05, 2.9171351343393326e-05]

可以看到，第二个输出的时间总是小得多，这就证明了这个性能优势是具有持久性的。

如果在做一些大数据研究，比如金融数据、股票数据的研究，使用Numpy能够节省你不少内存空间，并拥有更强大的性能。

声明：本站稿件版权均属千锋教育所有，未经许可不得擅自转载。

上一篇

数据结构的主要内容有哪些?

下一篇

HashMap为什么不用B+树来替换红黑树?

猜你喜欢LIKE

软件帮助文档怎么做?

为什么说int就是用来表达寄存器的?

依次插入结点法生成二叉排序树是什么意思?

最新文章NEW

流行的Java Web框架有哪些?

为什么Debug Information Format改为DWARF可以提高编译速度?

MySql什么是数据库架构设计?

相关推荐HOT

更多>>

vector容器原理是什么?

一、vector容器原理vector容器分配的是一块连续的内存空间，每次容器的增长，并不是在原有连续的内存空间后再进行简单的叠加，而是重新申请一块...详情>>

2023-10-20 18:14:35

单调栈什么时候从后向前遍历，什么时候从前向后遍历?

一、单调栈什么时候从后向前遍历，什么时候从前向后遍历如果是求右边的名列前茅个最大，那么就是从右向左遍历，构建单调递增栈。如果是求右边的...详情>>

2023-10-20 14:41:19

HashMap为什么不用B+树来替换红黑树?

一、HashMap不用B+树来替换红黑树的原因1、算法实现复杂Java中已经实现了红黑树，而B+树的实现还需要从头开始，复杂度会更高。2、底层不符合Has...详情>>

2023-10-20 14:08:41

数据结构的主要内容有哪些?

一、基本概念和术语1.数据数据是描述客观事物的符号，是计算机可以操作的对象，是能被计算机识别，并输入到计算机处理的符号集合。（数据不仅仅...详情>>

2023-10-20 13:16:16

热门推荐

流行的Java Web框架有哪些?

Glide做了哪些优化?

为什么Debug Information Format改为DWARF可以提高编译速度?

MySql什么是数据库架构设计?

什么是HTML5?

wiki怎么编辑页面?

常见的数据库管理系统有哪些?

macbook用什么文档软件?

软件帮助文档怎么做?

为什么Java提供了多种数据结构而python和go没有?

vector容器原理是什么?

跳表在OI里有什么应用?

数据结构适用于解决什么问题?

为什么说int就是用来表达寄存器的?

行业资讯 更多>>

千锋教育PMP考试喜报！满屏好消...

可评职称！各地PMP证书奖励政策

深圳软件测试培训学习费用大约多...

深圳线下软件测试培训多少钱？

技术干货

流行的Java Web框架有哪些?

流行的Java Web框架有哪些?

Glide做了哪些优化?

Glide做了哪些优化?

为什么Debug Information Format改为DWARF可以提高编译速度?

为什么Debug Information Format改为DWARF可以提高编译速度?

MySql什么是数据库架构设计?

MySql什么是数据库架构设计?

什么是HTML5?

什么是HTML5?

wiki怎么编辑页面?

wiki怎么编辑页面?

常见的数据库管理系统有哪些?

常见的数据库管理系统有哪些?

技术问答 在线提问>>

张同学在线提问

java归并排序算法是什么怎么操作

Java中的归并排序算法是一种基于分治思想的排...详情

刘同学在线提问

shutil模块python的操作方法

shutil模块还提供了丰富的功能来操作目录，以...详情

师资团队 更多>>

陆神

原去哪儿网高级架构师

北京大学计算机系毕业

HTML5学科教研总监

千锋威哥

OCP认证专家

15年以上开发经验

Java学科首席技术官

宋宋

原阿里后端架构师

北京邮电大学硕士

Python学科首席技术官

卢老师

北京大学博士后

北京科技大学博士

人工智能学科总监

索尔

原阿里后端架构师

浙工大计算机系毕业

Java学科高级讲师

jackfrued

曾任职华为成都研究所

计算机应用技术博士

Python学科教学主管

快速通道 更多>>

课程介绍
点击获取大纲
就业前景
查看就业薪资
学习费用
了解课程价格
优惠活动
领取优惠券
学习资源
领3000G教程
师资团队
了解师资团队
实战项目
获取项目源码
开班地区
查看来校路线

最新开班信息更多>>

网友热搜更多>>

IT行业年龄有限制吗女生学IT Java薪资待遇零基础Web培训 Python就业如何学UI设计大数据学习路线 java培训学费软件测试培训转行学Linux 网络安全基础知识网络营销培训 unity培训 30岁还能学it吗大数据技术学什么 python培训费

千锋教育

千锋学习站 | 随时随地免费学

千锋教育

扫一扫进入千锋手机站