并发编程的目的是为了让程序运行得更快,但是,并不是启动更多的线程就能让程序最大限度地并发执行。
即使是单核处理器也支持多线程执行代码,CPU 通过给每个线程分配 CPU 时间片来实现这个机制。
CPU 通过「时间片分配算法」来循环执行任务。每个线程会被分配一个时间片,即该线程允许运行的时间,如果在时间片结束时线程还在运行,则操作系统将强制剥夺此线程的 CPU 使用权限,并分配给另外的线程;如果线程在时间片结束前阻塞或结束,则 CPU 当即进行切换,而不会造成 CPU 资源浪费。
1. 上下文切换
任务的保存到再加载的过程就是一次上下文切换。
多线程不一定比单线程快,因为线程有创建和上下文切换的开销,上下文切换会影响多线程的执行速度。
举个例子,假设有一个工作台(CPU),每个人(线程)的效率都是 10 秒完成一个任务,一个人完成两个任务需要 20 秒,但是两个人完成两个任务需要 22 秒,因为除了完成任务的时间消耗,前一个人完成任务站起来离开工作台需要 1 秒,后一个人坐上工作台需要 1 秒(上下文切换),这样导致两个人 的效率还没有一个人高。
但是也有例外,如果有两个工作台,那么两个人完成两个任务就只需要 10 秒了。所以上下文切换的开销影响多线程的执行速度,前提是工作台(CPU)不够用。
如果线程任务中出现资源争抢、阻塞、锁等情况还会增加上下文切换的次数,进一步降低执行效率。
减少上下文切换的方法
-
无锁并发编程:多线程竞争锁时,会引起上下文切换,所以多线程处理数据时,可以用一些办法来避免使用锁。
-
CAS 算法:Compare And Swap,线程从主内存中拿到值,缓存本地,计算,更新时比较主内存中现有的值是否跟之前拿到的值一致,一致则更新(注意,这里的比较和更新是一个原子操作,要么都成功,要么都失败),不一致则一直自旋到更新成功。
-
使用最少线程:避免创建不需要的线程。
-
使用协程:在单线程里实现多任务调度。
2. 死锁
死锁一般是因为程序实现「获取和释放锁」的逻辑有问题,导致线程之间互相等待释放锁,却又永远获取不到锁。
死锁的出现,会导致程序直接卡死,业务暂停。
避免死锁的方法
-
避免一个线程同时获取多个锁。
-
避免一个线程在锁内同时占用多个资源,尽量保证每个锁只占用一个资源。
-
尝试使用定时锁,超时自动释放。
-
对于数据库锁,加锁和解锁必须在一个数据库连接里,否则会出现解锁失败的情况。
3. 资源限制
资源限制是指在进行并发编程时,程序的执行速度受限于计算机硬件资源或软件资源。
在并发编程中,提升代码执行效率的原则是将原本串行执行的部分改为并发执行,但是如果将某段串行代码并发执行,由于资源的限制,仍然在串行执行,这时候程序不仅不会加快执行,反而会更慢,因为增加了上下文切换和资源调度的时间。
硬件限制
-
带宽的上传/下载速度
-
硬盘读写速度
-
CPU 处理速度
软件限制
-
数据库连接数
-
socket 连接数
-
系统文件句柄数
-
…
如何解决资源限制的问题
-
对于硬件资源的限制,可以考虑使用集群并行执行程序。
-
对于软件资源的限制,可以考虑使用资源池将资源复用。
-
根据不同的资源限制调整程序的并发度。