问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501
你好,欢迎来到懂视!登录注册
当前位置: 首页 - 正文

一篇文章带你深度解析Python线程和进程

发布网友 发布时间:2022-11-17 15:43

我来回答

1个回答

热心网友 时间:2024-10-06 18:28

使用Python中的线程模块,能够同时运行程序的不同部分,并简化设计。如果你已经入门Python,并且想用线程来提升程序运行速度的话,希望这篇教程会对你有所帮助。

线程与进程

什么是进程

进程是系统进行资源分配和调度的一个独立单位 进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位。每个进程都有自己的独立内存空间,不同进程通过进程间通信来通信。由于进程比较重量,占据独立的内存,所以上下文进程间的切换开销(栈、寄存器、虚拟内存、文件句柄等)比较大,但相对比较稳定安全。

什么是线程

CPU调度和分派的基本单位 线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。线程间通信主要通过共享内存,上下文切换很快,资源开销较少,但相比进程不够稳定容易丢失数据。

进程与线程的关系图

线程与进程的区别:

进程

现实生活中,有很多的场景中的事情是同时进行的,比如开车的时候 手和脚共同来驾驶 汽车 ,比如唱歌跳舞也是同时进行的,再比如边吃饭边打电话;试想如果我们吃饭的时候有一个领导来电,我们肯定是立刻就接听了。但是如果你吃完饭再接听或者回电话,很可能会被开除。

注意:

多任务的概念

什么叫 多任务 呢?简单地说,就是操作系统可以同时运行多个任务。打个比方,你一边在用浏览器上网,一边在听MP3,一边在用Word赶作业,这就是多任务,至少同时有3个任务正在运行。还有很多任务悄悄地在后台同时运行着,只是桌面上没有显示而已。

现在,多核CPU已经非常普及了,但是,即使过去的单核CPU,也可以执行多任务。由于CPU执行代码都是顺序执行的,那么,单核CPU是怎么执行多任务的呢?

答案就是操作系统轮流让各个任务交替执行,任务1执行0.01秒,切换到任务2,任务2执行0.01秒,再切换到任务3,执行0.01秒,这样反复执行下去。表面上看,每个任务都是交替执行的,但是,由于CPU的执行速度实在是太快了,我们感觉就像所有任务都在同时执行一样。

真正的并行执行多任务只能在多核CPU上实现,但是,由于任务数量远远多于CPU的核心数量,所以,操作系统也会自动把很多任务轮流调度到每个核心上执行。 其实就是CPU执行速度太快啦!以至于我们感受不到在轮流调度。

并行与并发

并行(Parallelism)

并行:指两个或两个以上事件(或线程)在同一时刻发生,是真正意义上的不同事件或线程在同一时刻,在不同CPU资源呢上(多核),同时执行。

特点

并发(Concurrency)

指一个物理CPU(也可以多个物理CPU) 在若干道程序(或线程)之间多路复用,并发性是对有限物理资源强制行使多用户共享以提高效率。

特点

multiprocess.Process模块

process模块是一个创建进程的模块,借助这个模块,就可以完成进程的创建。

语法:Process([group [, target [, name [, args [, kwargs]]]]])

由该类实例化得到的对象,表示一个子进程中的任务(尚未启动)。

注意:1. 必须使用关键字方式来指定参数;2. args指定的为传给target函数的位置参数,是一个元祖形式,必须有逗号。

参数介绍:

group:参数未使用,默认值为None。

target:表示调用对象,即子进程要执行的任务。

args:表示调用的位置参数元祖。

kwargs:表示调用对象的字典。如kwargs = {'name':Jack, 'age':18}。

name:子进程名称。

代码:

除了上面这些开启进程的方法之外,还有一种以继承Process的方式开启进程的方式:

通过上面的研究,我们千方百计实现了程序的异步,让多个任务可以同时在几个进程中并发处理,他们之间的运行没有顺序,一旦开启也不受我们控制。尽管并发编程让我们能更加充分的利用IO资源,但是也给我们带来了新的问题。

当多个进程使用同一份数据资源的时候,就会引发数据安全或顺序混乱问题,我们可以考虑加锁,我们以模拟抢票为例,来看看数据安全的重要性。

加锁可以保证多个进程修改同一块数据时,同一时间只能有一个任务可以进行修改,即串行的修改。加锁牺牲了速度,但是却保证了数据的安全。

因此我们最好找寻一种解决方案能够兼顾:1、效率高(多个进程共享一块内存的数据)2、帮我们处理好锁问题。

mutiprocessing模块为我们提供的基于消息的IPC通信机制:队列和管道。队列和管道都是将数据存放于内存中 队列又是基于(管道+锁)实现的,可以让我们从复杂的锁问题中解脱出来, 我们应该尽量避免使用共享数据,尽可能使用消息传递和队列,避免处理复杂的同步和锁问题,而且在进程数目增多时,往往可以获得更好的可获展性( 后续扩展该内容 )。

线程

Python的threading模块

Python 供了几个用于多线程编程的模块,包括 thread, threading 和 Queue 等。thread 和 threading 模块允许程序员创建和管理线程。thread 模块 供了基本的线程和锁的支持,而 threading 供了更高级别,功能更强的线程管理的功能。Queue 模块允许用户创建一个可以用于多个线程之间 共享数据的队列数据结构。

python创建和执行线程

创建线程代码

1. 创建方法一:

2. 创建方法二:

进程和线程都是实现多任务的一种方式,例如:在同一台计算机上能同时运行多个QQ(进程),一个QQ可以打开多个聊天窗口(线程)。资源共享:进程不能共享资源,而线程共享所在进程的地址空间和其他资源,同时,线程有自己的栈和栈指针。所以在一个进程内的所有线程共享全局变量,但多线程对全局变量的更改会导致变量值得混乱。

代码演示:

得到的结果是:

首先需要明确的一点是GIL并不是Python的特性,它是在实现Python解析器(CPython)时所引入的一个概念。就好比C++是一套语言(语法)标准,但是可以用不同的编译器来编译成可执行代码。同样一段代码可以通过CPython,PyPy,Psyco等不同的Python执行环境来执行(其中的JPython就没有GIL)。

那么CPython实现中的GIL又是什么呢?GIL全称Global Interpreter Lock为了避免误导,我们还是来看一下官方给出的解释:

主要意思为:

因此,解释器实际上被一个全局解释器锁保护着,它确保任何时候都只有一个Python线程执行。在多线程环境中,Python 虚拟机按以下方式执行:

由于GIL的存在,Python的多线程不能称之为严格的多线程。因为 多线程下每个线程在执行的过程中都需要先获取GIL,保证同一时刻只有一个线程在运行。

由于GIL的存在,即使是多线程,事实上同一时刻只能保证一个线程在运行, 既然这样多线程的运行效率不就和单线程一样了吗,那为什么还要使用多线程呢?

由于以前的电脑基本都是单核CPU,多线程和单线程几乎看不出差别,可是由于计算机的迅速发展,现在的电脑几乎都是多核CPU了,最少也是两个核心数的,这时差别就出来了:通过之前的案例我们已经知道,即使在多核CPU中,多线程同一时刻也只有一个线程在运行,这样不仅不能利用多核CPU的优势,反而由于每个线程在多个CPU上是交替执行的,导致在不同CPU上切换时造成资源的浪费,反而会更慢。即原因是一个进程只存在一把gil锁,当在执行多个线程时,内部会争抢gil锁,这会造成当某一个线程没有抢到锁的时候会让cpu等待,进而不能合理利用多核cpu资源。

但是在使用多线程抓取网页内容时,遇到IO阻塞时,正在执行的线程会暂时释放GIL锁,这时其它线程会利用这个空隙时间,执行自己的代码,因此多线程抓取比单线程抓取性能要好,所以我们还是要使用多线程的。

GIL对多线程Python程序的影响

程序的性能受到计算密集型(CPU)的程序*和I/O密集型的程序*影响,那什么是计算密集型和I/O密集型程序呢?

计算密集型:要进行大量的数值计算,例如进行上亿的数字计算、计算圆周率、对视频进行高清解码等等。这种计算密集型任务虽然也可以用多任务完成,但是花费的主要时间在任务切换的时间,此时CPU执行任务的效率比较低。

IO密集型:涉及到网络请求(time.sleep())、磁盘IO的任务都是IO密集型任务,这类任务的特点是CPU消耗很少,任务的大部分时间都在等待IO操作完成(因为IO的速度远远低于CPU和内存的速度)。对于IO密集型任务,任务越多,CPU效率越高,但也有一个限度。

当然为了避免GIL对我们程序产生影响,我们也可以使用,线程锁。

Lock&RLock

常用的资源共享锁机制:有Lock、RLock、Semphore、Condition等,简单给大家分享下Lock和RLock。

Lock

特点就是执行速度慢,但是保证了数据的安全性

RLock

使用锁代码操作不当就会产生死锁的情况。

什么是死锁

死锁:当线程A持有独占锁a,并尝试去获取独占锁b的同时,线程B持有独占锁b,并尝试获取独占锁a的情况下,就会发生AB两个线程由于互相持有对方需要的锁,而发生的阻塞现象,我们称为死锁。即死锁是指多个进程因竞争资源而造成的一种僵局,若无外力作用,这些进程都将无法向前推进。

所以,在系统设计、进程调度等方面注意如何不让这四个必要条件成立,如何确定资源的合理分配算法,避免进程永久占据系统资源。

死锁代码

python线程间通信

如果各个线程之间各干各的,确实不需要通信,这样的代码也十分的简单。但这一般是不可能的,至少线程要和主线程进行通信,不然计算结果等内容无法取回。而实际情况中要复杂的多,多个线程间需要交换数据,才能得到正确的执行结果。

python中Queue是消息队列,提供线程间通信机制,python3中重名为为queue,queue模块块下提供了几个阻塞队列,这些队列主要用于实现线程通信。

在 queue 模块下主要提供了三个类,分别代表三种队列,它们的主要区别就在于进队列、出队列的不同。

简单代码演示

此时代码会阻塞,因为queue中内容已满,此时可以在第四个queue.put('苹果')后面添加timeout,则成为 queue.put('苹果',timeout=1)如果等待1秒钟仍然是满的就会抛出异常,可以捕获异常。

同理如果队列是空的,无法获取到内容默认也会阻塞,如果不阻塞可以使用queue.get_nowait()。

在掌握了 Queue 阻塞队列的特性之后,在下面程序中就可以利用 Queue 来实现线程通信了。

下面演示一个生产者和一个消费者,当然都可以多个

使用queue模块,可在线程间进行通信,并保证了线程安全。

协程

协程,又称微线程,纤程。英文名Coroutine。

协程是python个中另外一种实现多任务的方式,只不过比线程更小占用更小执行单元(理解为需要的资源)。为啥说它是一个执行单元,因为它自带CPU上下文。这样只要在合适的时机, 我们可以把一个协程 切换到另一个协程。只要这个过程中保存或恢复 CPU上下文那么程序还是可以运行的。

通俗的理解:在一个线程中的某个函数,可以在任何地方保存当前函数的一些临时变量等信息,然后切换到另外一个函数中执行,注意不是通过调用函数的方式做到的,并且切换的次数以及什么时候再切换到原来的函数都由开发者自己确定。

在实现多任务时,线程切换从系统层面远不止保存和恢复 CPU上下文这么简单。操作系统为了程序运行的高效性每个线程都有自己缓存Cache等等数据,操作系统还会帮你做这些数据的恢复操作。所以线程的切换非常耗性能。但是协程的切换只是单纯的操作CPU的上下文,所以一秒钟切换个上百万次系统都抗的住。

greenlet与gevent

为了更好使用协程来完成多任务,除了使用原生的yield完成模拟协程的工作,其实python还有的greenlet模块和gevent模块,使实现协程变的更加简单高效。

greenlet虽说实现了协程,但需要我们手工切换,太麻烦了,gevent是比greenlet更强大的并且能够自动切换任务的模块。

其原理是当一个greenlet遇到IO(指的是input output 输入输出,比如网络、文件操作等)操作时,比如访问网络,就自动切换到其他的greenlet,等到IO操作完成,再在适当的时候切换回来继续执行。

模拟耗时操作:

如果有耗时操作也可以换成,gevent中自己实现的模块,这时候就需要打补丁了。

使用协程完成一个简单的二手房信息的爬虫代码吧!

以下文章来源于Python专栏 ,作者宋宋

文章链接:https://mp.weixin.qq.com/s/2r3_ipU3HjdA5VnqSHjUnQ

一篇文章带你深度解析Python线程和进程

全局解释器锁(GIL)是CPython实现中的一个互斥锁,它确保任何时候只有一个Python线程执行。由于GIL的存在,Python的多线程不能称为严格的多线程。但多线程在IO密集型任务中仍然具有性能优势。为了避免GIL的影响,可以使用线程锁(Lock和RLock)等机制。死锁是指多个进程因竞争资源而造成的一种僵局,可以通...

一篇文章带你深度解析Python线程和进程

CPU调度和分派的基本单位 线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位.线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。线程间通信主要通过共享内存,上下文...

python单核最多能开多少线程(2023年最新整理)

python中的多线程实质上是对上下文的不断切换,可以说是假的多线程。而我们知道,io操作不占用cpu,计算占用cpu,那么python的多线程适合io操作密集的任务,比如socket-server,那么cpu密集型的任务,python怎么处理?python可以折中的利用计算机的多核:启动八个进程,每个进程有一个线程。这样就可以利用多进程解决多核问题。请...

python线程多少合适

一篇文章带你深度解析Python线程和进程 使用Python中的线程模块,能够同时运行程序的不同部分,并简化设计。如果你已经入门Python,并且想用线程来提升程序运行速度的话,希望这篇教程会对你有所帮助。 线程与进程 什么是进程 进程是系统进行资源分配和调度的一个独立单位进程是具有一定独立功能的程序关于某个数据集合上的一...

一篇文章带你了解Python常用自动化测试框架——Pytest

执行流程,以及如何利用前后置方法进行测试控制。进阶内容中,Pytest的Allure效果美化可以提升测试报告的视觉效果,而Parametrize数据驱动则是通过Yaml文件实现数据驱动,提高测试的灵活性和可复用性。总的来说,Pytest不仅语法简洁,且功能强大,能有效提升Python项目的测试效率和代码质量。

python线程多少秒完成?

pythony中子进程如果一定时间不结束就停止应该如何做? 你要用thread模块的话,要main里面sleep一段时间,如果子线程没结束,直接走main下面的代码,子线程会自动被杀掉的。当然,这也是Thread模块的缺点,不管子进程是否结束,一旦继续走主线程,子线程统统杀掉。 如果你用threading模块的话,只要不给子线程设定为守护进程也...

什么是Python爬虫?一篇文章带你全面了解爬虫

一、定义与用途 爬虫,简称“网络爬虫”,是一种自动访问互联网并下载网站内容的程序。它不仅是搜索引擎的基础,例如百度和谷歌,也是企业获取数据、分析用户需求的重要工具。企业可以通过爬虫软件从用户论坛获取留言,了解用户需求和偏好,为产品迭代提供依据。二、原理与流程 爬虫工作原理包括发起请求、获取...

什么是Python爬虫?一篇文章带你全面了解爬虫

Python爬虫实例包括前期准备、目标设定与具体代码实现。首先,需安装Python环境、PYCHARM软件、MYSQL数据库,并创建数据库exam与存放爬虫结果的表house。目标为从链家租房网站抓取房源信息,如价格、单位及面积,并存入数据库。Python爬虫通过导入requests、BeautifulSoup、pymysql与lxml库完成请求、解析与数据库交互...

Python语言基础(python语言基础与应用网课答案)

3、导入是将python的一些功能函数放到当前的脚本中使用,不导入的功能无法直接在当前脚本使用。 4、python脚本的入口叫主函数main。 5、每个变量被定义后存入一个内存块。 万字干货,Python语法大合集,一篇文章带你入门 这份资料非常纯粹,只有Python的基础语法,专门针对想要学习Python的小白。 Python中用#表示单行注释,#...

Python:一篇文章掌握Numpy的基本用法

掌握Python中Numpy的基本用法,这篇文章将带你入门。1. Numpy的核心:ndarray数组Numpy的核心是多维数组ndarray,它包含两个部分:高效的数据结构和丰富的数学运算功能。通过向量化和标量化运算的对比,可以看出Numpy的运算效率远超Python循环(效率提升数百倍)。2. 创建和理解ndarray开始使用Numpy,首先导入并...

声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
E-MAIL:11247931@qq.com
麻烦介绍几款4000左右性能好的笔记本电脑 三千到四千可以买到的高性价比的笔记本电脑? 想买台电脑,I3或I5不知配置怎样配才好,还请高手指教... 如何辨别电视机的好坏 ...长宽高的比是6:5:4他的表面积和体积各是多少?把他截成2个小长方体... 体育门票收入要交什么税 它的表面积和体积是多少? 夏天有哪些景和物 荷花世界景区美食 为什么word转换pdf文件后有些图片显示不出来 不需要验证码注册的账号具有合法效益吗 政府办公公文落款日期用阿拉伯数字还是汉语大写数字 古诗书写的两种行款分别是什么 表示一个数字是几位数适用于文字还是数学字 13pro长按不能换壁纸了 每天三分钟知晓天下事是什么app 八年级上册历史第一单元测试题及答案(2) 童年的馒头近义词当中干涸的近义词是什么? 在《少年王勃》这一课当中打算的近义词是什么 琴声一文当中的卓越的近义词勤奋的近义词明白的近义词 ...走街串巷,梦寐以求,疑惑不解,春雨如油,当中谁是近义词构成... 我爸爸明天做胃镜,医生要和我签风险书,我应该怎么和医生说 一位聊的挺好的朋友,他是医生,他和我说他有些不舒服,我该怎么说呢? 医生第一次凶我,和我讲了,许多道理,给我上了一课,之后我哭了,他有... 为什么40多岁的男医生见了我几次以后 有次和我说话就搂我靠的很近... 我的主治医生喜欢和我开玩笑是怎么回事? 茶楼装修设计要素是什么? 被封了怎么解开 北京步峰信息技术有限公司怎么样? 光大永明资产管理股份有限公司电话是多少? 基于Python 的 Web Server 与 Python 后台服务进程之间用什么方式通信... 药品市场营销的核心是 散步减肥和跑步减肥哪个好? 西梅大小2个J什么意思 很久很久以前的地球是不是汪洋大海? ...给我来了一个ip地址:222.66.44.0/25,请问各位大侠,这是什么意思? linux ifconfig 配ip后面加斜杠数字是什么意思 oppo手机激活时间在哪里看 通过手机打电话车库门能远程打开吗 红包零钱明细记录怎么删除 python合法的标识符 美容院开背刮痧用什么油 美容院用的什么油 依法从公证处查证后应加盖什么章? 余额宝转账资金被冻结了怎么办 640视频处理器只有四个图层嘛 松下4k摄像机接到大屏处理器上没信号怎么办 如何两台24路硬盘录像机把画面平均分配到4个挂壁显示屏... 信用卡关闭透支功能是啥意思 拼拼有礼提不了现怎么办? 纯电动汽车什么牌子好
  • 焦点

最新推荐

猜你喜欢

热门推荐