C#并行与多线程——Parallel并行
- 2019 年 12 月 9 日
- 笔记
从线程说起
线程分为软件线程和硬件线程。
硬件线程又叫做逻辑内核,我们可以在”任务管理器“中查看”性能“标签页,就能查看电脑的线程数,我们常说的四核八线程,就是指这个,当然这里的四核八线程,其中的八线程是超线程技术,也就是一个核心对应两个线程,从而从硬件层面提升执行性能。
至于软件线程,我们知道一般来说代码都是串行的,就一个主线程,当我们为了实现加速而开了很多工作线程,这些工作线程,也就是软件线程。
线程管理
在.net 4.0之后的版本中,微软给我们提供了一个新的命名空间:System.Threading.Tasks。
这个命名空间提供了一系列的操作类来供我们对线程进行控制。
并行Parallel
在Parallel下面有三个常用的方法invoke,For和ForEach。
先说下StopWatch,这个类主要用于测速,记录时间。
StopWatch 位于 System.Diagnostics
命名空间,StopWatch有如下方法:
- var stopWatch = new StopWatch(); //创建一个Stopwatch实例
- stopWatch.Start(); //开始计时
- stopWatch.Stop(); //停止计时
- stopWatch.Reset(); //重置StopWatch
- stopWatch.Restart(); //重新启动被停止的StopWatch
- stopWatch.ElapsedMilliseconds //获取stopWatch从开始到现在的时间差,单位是毫秒
引入
System.Threading
(MSDN-System.Threading Namespace) 和System.Threading.Tasks
(MSDN-System.Threading.Tasks Namespace) 来使用Parallel。
Parallel.invoke()
public void Run1() { Thread.Sleep(2000); Console.WriteLine("Task 1 is cost 2 sec"); } public void Run2() { Thread.Sleep(3000); Console.WriteLine("Task 1 is cost 3 sec"); }
写两个方法,一个让线程睡眠2s(2000ms),另一个让线程睡眠3s。
通过计时来观察,程序执行的过程,和Parallel的执行。
public void ParallelInvokeMethod() { sp.Start(); Parallel.Invoke(Run1, Run2); sp.Stop(); Console.WriteLine("Parallel run " + sp.ElapsedMilliseconds + " ms."); sp.Restart(); Run1(); Run2(); sp.Stop(); Console.WriteLine("Normal run " + sp.ElapsedMilliseconds + " ms."); }
实例化该方法并在mian函数中调用执行,可以从结果中观察到,该方法两段程序的执行结果的差异。
很直观的看出,使用Parallel.Invoke()
之后,Run1和Run2是并行执行的,一共用时3s(3000ms左右),而直接运行Run1和Run2则耗时5s。
Parallel.For()
Parallel.For()的用法和 For 类似,直接看代码:
public void ParallelForMethod() { Stopwatch sp = new Stopwatch(); sp.Start(); for (int i = 0; i < 10000; i++) { for (int j = 0; j < 60000; j++) { int sum = 0; sum+=i; } } sp.Stop(); Console.WriteLine("NormalFor run " + sp.ElapsedMilliseconds + " ms."); sp.Reset(); sp.Start(); Parallel.For(0, 10000, item => { for (int j = 0; j < 60000; j++) { int sum = 0; sum += item; } }); sp.Stop(); Console.WriteLine("ParallelFor run " + sp.ElapsedMilliseconds + " ms."); }
一个使用Parallel.For的双层循环累加,和一个普通的双层循环累加,执行时间的差距却非常大。
Parallel.For实际上是并行执行了循环,因为内部只是一个单纯的累加,因此效率差异明显,但是并非所有的场景都适合使用并行循环。
修改一下上面的方法。
public void ParallelForMethodFromGV() { var obj = new Object(); long num = 0; sp.Start(); for (int i = 0; i < 10000; i++) { for (int j = 0; j < 60000; j++) { num++; } } sp.Stop(); Console.WriteLine("NormalFor run " + sp.ElapsedMilliseconds + " ms."); sp.Reset(); sp.Start(); Parallel.For(0, 10000, item => { for (int j = 0; j < 60000; j++) { lock (obj) { num++; } } }); sp.Stop(); Console.WriteLine("ParallelFor run " + sp.ElapsedMilliseconds + " ms."); }
改为操作一个全局变量的累加,这个时候由于并行请求,需要等待调用内存中的全局变量num,效率反而降低。
同样的,由于并行处理的原因,For的结果并不是按照原有顺序进行的:
public void ParallelForCW() { Parallel.For(0, 100, i => { Console.Write(i + "t"); }); }
Parallel.For虽然在执行效率上高于For,但是必须要在符合条件的场景下使用!
Parallel.ForEach()
ForEach是For的拓展,用于遍历数组或则list对象,实际上的意义和用法与For相同,因此Parallel中的 ForEach也是这般,这里不过多赘述。
Stopwatch sp = new Stopwatch(); public void ParallelForEachMethod() { int[] arr = { 0,1,2,2,3,3,123,123,12,31,231,23,1,231,3,13,1,231,23,123,1,23,123,12,31,23,123,12,312,3,123,1,23}; List<int> list = new List<int>(arr); List<int> list2 = new List<int>(arr); sp.Start(); Parallel.ForEach(arr, item => { list.Add(item); }); sp.Stop(); Console.WriteLine("ParallelForEach run " + sp.ElapsedMilliseconds + " ms."); sp.Restart(); foreach (var item in arr) { list2.Add(item); } sp.Stop(); Console.WriteLine("NormalForEach run " + sp.ElapsedMilliseconds + " ms."); }