**摘要:**在2005年之后,单核标量处理器的性能基本上达到顶峰,很难进一步大幅度(超过10%)提升性能。
本文分享自华为云社区《高性能计算(1)——读史知兴替》,作者: 我是一颗大西瓜 。
在2005年之前,大多数处理器都是单核的,一些处理器已经开始 支持向量化(如X86处理器支持的MMX(多媒体扩展)和SSE(流式SIMD扩展)指令集),处理器生产商通过提升单核标量处理器的频率和指令级并行处理能力(即提升指令流水线性能)来提升处理器的计算性能。
在2005年之前,单核标量处理器的性能基本上是每18个月近似提升一倍,这称为摩尔定律,如下图所示。单核标量处理器性能提升能满足摩尔定律的时期称为提升软件性能的“免费午餐”时期,因为单核标量代码的性能可以满足摩尔定律描述的速度提升。
在2005年之后,单核标量处理器的性能基本上达到顶峰,很难进一步大幅度(超过10%)提升性能——为什么?
单核标量处理器以近似摩尔定律的方式提升性 能,其主要通过以下几种方式提升性能:
因此,由于散热导致处理器的频率不能接着提升,硬件生产商转而采用将多个处理器组成到一个芯片上,这称为多核;为了提供更高性能的处理器,处理器硬件生产商通过增加寄存器的宽度和指令的宽度来同时处理多个数据,这称为向量化。
多核和向量化的难点:
异构并行时代的崛起是从2007年NVIDIA推出CUDA(Computing Unified Device Architecture,计算统一设备架构)开始的。异构并行包含两个子概念:
当前CPU的发展已经落后于摩尔定律,但GPU仍然在快速发展中。CPU和GPU都是具有运算能力的芯片。 其中,CPU不但擅长于指令运算,而且擅长于各类数值运算;而GPU是专门为处理图形任务而产生的芯片,仅擅长于图形函数类
数值计算。从硬件设计上来讲,CPU由专为顺序串行处理而优化的几个核心组成。另一方面, GPU则由数以千计的更小、更高效的核心组成,这些核心专为同时处理多任务而设计。
总之,GPU是面向适合于矩阵类型图形函数的数值计算而设计的。它利用大量重复设计的运算单元建立大量数值运算的线程,擅长无逻辑关系的大量平行数据的高度并行数值计算。 而CPU是根据兼顾 “指令并行执行” 和 “数据并行运算” 的思路进行设计,擅长处理拥有复杂指令调度、循环、分支、逻辑判断以及执行等的程序任务。
华为伙伴暨开发者大会2022火热来袭,重磅内容不容错过!
【精彩活动】
勇往直前·做全能开发者→12场技术直播前瞻,8大技术宝典高能输出,还有代码密室、知识竞赛等多轮神秘任务等你来挑战。即刻闯关,开启终极大奖!点击踏上全能开发者晋级之路吧!
【技术专题】
未来已来,2022技术探秘→华为各领域的前沿技术、重磅开源项目、创新的应用实践,站在智能世界的入口,探索未来如何照进现实,干货满满点击了解
版权说明 : 本文为转载文章, 版权归原作者所有 版权申明
原文链接 : https://huaweicloud.blog.csdn.net/article/details/125218456
内容来源于网络,如有侵权,请联系作者删除!