首页
社区
课程
招聘
.NET 4.6中的性能改进
发表于: 2015-7-24 07:05 1233

.NET 4.6中的性能改进

2015-7-24 07:05
1233
新闻链接:25bK9s2c8@1M7q4)9K6b7g2)9J5c8W2)9J5c8Y4N6%4N6#2)9J5k6h3W2F1k6X3!0I4i4K6u0W2j5$3!0E0i4K6u0r3j5$3&6Q4x3V1k6F1k6i4N6K6i4K6u0r3x3U0l9I4y4g2)9J5c8U0l9%4i4K6u0r3e0X3g2@1i4K6u0V1y4o6k6Q4x3X3c8b7k6i4u0X3L8%4u0E0j5h3&6U0k6g2)9K6c8Y4g2@1L8g2)9#2k6Y4y4G2N6i4u0U0k6g2)9K6c8s2c8#2K9h3y4G2L8$3H3`.
新闻时间:2015年7月23日
新闻正文:
NET 4.6中带来了一些与性能改进相关的CLR特性,这些特性中有一部分将会自动生效,而另外一些特性,例如SIMD与异步本地存储(Async Local Storage)则需要对编写应用的方式进行某些改动。

SIMD
Mono团队一直以他们对SIMD,即单指令流多数据流特性的支持引以为傲。SIMD是一种CPU指令集,它能够在同一时间对最多8个值进行同一操作。而随着.NET CLR版本4.6的推出,Windows开发者终于也能够使用这一特性了。

为了实际观察一下SIMD的效果,可以参考一下这个示例。假设你需要通过c[i] = a[i] + b[i]这种形式对两个数组进行相加,以得到第三个数组。通过使用SIMD,你可以按照以下方式编写代码:

for (int i = 0; i < size; i += Vector.Count)
{
     Vector v = new Vector(A,i) + new Vector(B,i);
     v.CopyTo(C,i);
}
请注意这个循环是如何按Vector<int>.Count的取值进行递增的,根据CPU类型的不同,它的取值可能是4或是8。.NET JIT编译器将根据CPU的不同生成相应的代码,以4或8的值对数组进行批量相加。

这种方式看起来有些繁琐,因此微软还提供了一系列辅助类,包括:
    Matrix3x2 结构A:
                   1c1K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6E0M7$3c8F1i4K6u0W2L8h3W2U0M7X3!0K6L8$3k6@1i4K6u0W2j5$3!0E0i4K6u0r3k6h3&6Q4x3X3c8#2M7#2)9J5c8X3I4A6j5Y4u0S2M7Y4W2Q4x3V1k6K6P5i4y4@1k6h3#2Q4x3X3g2F1N6h3#2W2M7X3W2U0M7#2)9J5k6h3#2S2N6s2u0A6P5o6y4^5x3W2)9J5z5s2k6Q4x3@1c8$3M7#2)9J5k6e0p5I4x3g2)9J5z5g2)9J5k6h3q4K6M7s2R3`.

    Matrix4x4结构:
                   e51K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6E0M7$3c8F1i4K6u0W2L8h3W2U0M7X3!0K6L8$3k6@1i4K6u0W2j5$3!0E0i4K6u0r3k6h3&6Q4x3X3c8#2M7#2)9J5c8X3I4A6j5Y4u0S2M7Y4W2Q4x3V1k6K6P5i4y4@1k6h3#2Q4x3X3g2F1N6h3#2W2M7X3W2U0M7#2)9J5k6h3#2S2N6s2u0A6P5o6c8^5y4q4)9J5z5s2k6Q4x3@1c8$3M7#2)9J5k6e0p5I4x3g2)9J5z5g2)9J5k6h3q4K6M7s2R3`.

    Plane结构:
                   7b2K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6E0M7$3c8F1i4K6u0W2L8h3W2U0M7X3!0K6L8$3k6@1i4K6u0W2j5$3!0E0i4K6u0r3k6h3&6Q4x3X3c8#2M7#2)9J5c8X3I4A6j5Y4u0S2M7Y4W2Q4x3V1k6K6P5i4y4@1k6h3#2Q4x3X3g2F1N6h3#2W2M7X3W2U0M7#2)9J5k6i4m8D9j5h3&6W2i4K6t1^5N6W2)9K6c8s2k6K6i4K6u0W2x3e0p5I4i4K6t1&6i4K6u0W2j5i4y4H3P5l9`.`.

    Quaternion结构:
                   645K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6E0M7$3c8F1i4K6u0W2L8h3W2U0M7X3!0K6L8$3k6@1i4K6u0W2j5$3!0E0i4K6u0r3k6h3&6Q4x3X3c8#2M7#2)9J5c8X3I4A6j5Y4u0S2M7Y4W2Q4x3V1k6K6P5i4y4@1k6h3#2Q4x3X3g2F1N6h3#2W2M7X3W2U0M7#2)9J5k6i4q4#2j5i4c8W2M7X3&6A6L8$3&6Q4x3U0S2$3i4K6y4p5N6Y4y4Q4x3X3f1I4x3e0q4Q4x3U0W2Q4x3X3g2S2M7%4m8^5

    Vector 类:
                   ba7K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6E0M7$3c8F1i4K6u0W2L8h3W2U0M7X3!0K6L8$3k6@1i4K6u0W2j5$3!0E0i4K6u0r3k6h3&6Q4x3X3c8#2M7#2)9J5c8X3I4A6j5Y4u0S2M7Y4W2Q4x3V1k6K6P5i4y4@1k6h3#2Q4x3X3g2F1N6h3#2W2M7X3W2U0M7#2)9J5k6i4k6W2j5%4c8G2M7W2)9J5z5s2k6Q4x3@1c8$3M7#2)9J5k6e0p5I4x3g2)9J5z5g2)9J5k6h3q4K6M7s2R3`.

    Vector(T) 结构:
                   a53K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6E0M7$3c8F1i4K6u0W2L8h3W2U0M7X3!0K6L8$3k6@1i4K6u0W2j5$3!0E0i4K6u0r3k6h3&6Q4x3X3c8#2M7#2)9J5c8X3I4A6j5Y4u0S2M7Y4W2Q4x3V1k6V1L8U0R3#2z5o6x3^5y4g2)9J5z5s2k6Q4x3@1c8$3M7#2)9J5k6e0p5I4x3g2)9J5z5g2)9J5k6h3q4K6M7s2R3`.

    Vector2结构:
                   bd4K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6E0M7$3c8F1i4K6u0W2L8h3W2U0M7X3!0K6L8$3k6@1i4K6u0W2j5$3!0E0i4K6u0r3k6h3&6Q4x3X3c8#2M7#2)9J5c8X3I4A6j5Y4u0S2M7Y4W2Q4x3V1k6K6P5i4y4@1k6h3#2Q4x3X3g2F1N6h3#2W2M7X3W2U0M7#2)9J5k6i4k6W2j5%4c8G2M7U0u0Q4x3U0S2$3i4K6y4p5N6Y4y4Q4x3X3f1I4x3e0q4Q4x3U0W2Q4x3X3g2S2M7%4m8^5

    Vector3结构:
                   9b7K9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6E0M7$3c8F1i4K6u0W2L8h3W2U0M7X3!0K6L8$3k6@1i4K6u0W2j5$3!0E0i4K6u0r3k6h3&6Q4x3X3c8#2M7#2)9J5c8X3I4A6j5Y4u0S2M7Y4W2Q4x3V1k6K6P5i4y4@1k6h3#2Q4x3X3g2F1N6h3#2W2M7X3W2U0M7#2)9J5k6i4k6W2j5%4c8G2M7U0y4Q4x3U0S2$3i4K6y4p5N6Y4y4Q4x3X3f1I4x3e0q4Q4x3U0W2Q4x3X3g2S2M7%4m8^5

    Vector4结构:
                   fdcK9s2c8@1M7s2y4Q4x3@1q4Q4x3V1k6Q4x3V1k6E0M7$3c8F1i4K6u0W2L8h3W2U0M7X3!0K6L8$3k6@1i4K6u0W2j5$3!0E0i4K6u0r3k6h3&6Q4x3X3c8#2M7#2)9J5c8X3I4A6j5Y4u0S2M7Y4W2Q4x3V1k6K6P5i4y4@1k6h3#2Q4x3X3g2F1N6h3#2W2M7X3W2U0M7#2)9J5k6i4k6W2j5%4c8G2M7U0c8Q4x3U0S2$3i4K6y4p5N6Y4y4Q4x3X3f1I4x3e0q4Q4x3U0W2Q4x3X3g2S2M7%4m8^5

程序集卸载

恐怕大多数开发者都不知道这一点:.NET经常会对同一个程序集加载两次。发生这种情况的条件是.NET首先加载了某个程序集的IL版本,随后又加载了同一程序集的NGEN版本(即预编译版本)。这种方式对于物理内存来说是相当严重的浪费,尤其是对诸如Visual Studio这样的大型32位应用程序来说更为明显。

而在.NET 4.6中,一旦CLR加载了某个程序集的NGEN版本,它会自动清空对应的IL版本所占用的内存。

垃圾回收
早先我们曾讨论过.NET 4.0中所引入的垃圾回收滞后时间模式,虽然这种方式比起让GC完全停止一段时间的做法要可靠许多,但对于许多GC场景来说,这种方式仍算不上完整。

在.NET 4.6中,你将能够通过一种更精密的方式临时中止垃圾回收器的运作,新的TryStartNoGCRegion方法允许你指定在小对象以及大对象的堆中需要多少内存。

如果出现内存不足的情况,运行时将会返回false,或是停止运行,直到通过GC清理得到足够的内存为止。你可以通过为TryStartNoGCRegion传入某个标记的方式控制这一行为,如果你成功地进入了某个无GC区域(在过程结束前不允许进行GC),那么在过程结束时必须调用EndNoGCRegion方法。

在官方文档中并没有说明该方法是否是线程安全的,不过考虑到GC的工作原理,你应当尽量避免让两个进程同时尝试改变GC状态的做法。

对于GC的另一项改进是它处理pinned对象(即一旦分配后不可移动位置的对象)的方式。虽然在文档中对此方面的描述有些语焉不详,但当你固定了某个对象的位置时,通常也会固定其相邻对象的位置。Rich Lander在文中写道:

                GC将以一种更优化的方式处理pinned对象,因此GC能够将pinned对象周围的内存进行更有效地压缩。对于大量使用pin方式的大规模应用来说,这一改动将极大地改进应用的性能。
GC对于如何使用较早的几代中的内存方面也体现出更好的智能性,Rich继续写道:

                第1代对象升级为第2代对象的方式也得到了改进,以更有效地使用内存。在为某一代分配新的内存空间之前,GC会先尝试使用可用的空间。同时,在利用可用空间区域创建对象时使用了新的算法,使新分配的空间大小比起从前更接近于对象的大小。

异步本地存储
最后一项改进与性能并没有直接的关系,但通过有效的利用仍然能达到优化的效果。在异步API还没有流行起来的年代,开发者可以利用线程本地存储(TLS)缓存信息。TLS对于某个特定的线程来说就像是一种全局对象,这意味着你可以直接访问上下文信息并进行缓存,而无需显式地传递某种上下文对象。

而在async/await模式中,线程本地存储就变得毫无用武之地了。因为每次调用await的时候,都有可能跳转至另一个线程。而且即便侥幸避开了这种情况,但其它代码也有可能跳转到你的线程中并干扰TLS中的信息。

新版本的.NET引入了异步本地存储(ALS)机制以解决这一问题,ALS在语义上等价于线程本地存储,但它能够随着await的调用进行相应的跳转。这一功能将通过AsyncLocal泛型类实现,其内部将调用CallContext对象用于保存数据。

查看英文原文:098K9s2c8@1M7q4)9K6b7g2)9J5c8W2)9J5c8Y4N6%4N6#2)9J5k6h3W2F1k6X3!0I4i4K6u0W2j5$3!0E0i4K6u0r3L8X3g2%4M7#2)9J5c8U0t1H3x3e0g2Q4x3V1j5H3y4#2)9J5c8V1&6W2N6q4)9J5k6o6b7$3i4K6u0V1f1r3g2J5k6X3!0J5L8h3q4F1j5$3f1`.

[培训]科锐逆向工程师培训第53期2025年7月8日开班!

收藏
免费 0
支持
分享
最新回复 (0)
游客
登录 | 注册 方可回帖
返回