商业源码服务器教程 2023-11-28 0:44:02

听说GPU可以提高服务器计算速度，想给戴尔r710服务器配个GPU ，不知道支持不？麻烦高手给点指导性意见

只要服务器中有PCI-E X16的总线，就可以安装。

但GPU加速必须受到软件的支持，而且只对可以并行化的运算进行加速。另外，Nvidia显卡需要使用CUDA编程来实现加速功能，不是插上就能用的，AMD则需要Stream。一般都是用作高性能计算（HPC）的辅助计算加速卡，对于商务应用来说，没什么实际作用。不建议安装。

1GPU：计算机图显核心

11 GPU：计算机图形显示核心

GPU基本概念：图形处理器（graphics processing unit，缩写GPU），又称显示核心、视觉处理器、显示芯片，是一种专门在个人电脑、工作站、游戏机和一些移动设备（如平板电脑、智能手机等）上做图像和图形相关运算工作的微处理器。

GPU是显卡的处理器：显卡全称显示适配卡，又称显示适配器，用于协助CPU进行图像处理，作用是将CPU送来的图像信号经过处理再输送到显示器上，由主板连接设备、监视器连接设备、处理器和内存组成，GPU即是显卡处理器。

12 GPU擅长大规模并发计算

GPU工作原理：GPU的工作通俗的来说就是完成3D图形的生成，将图形映射到相应的像素点上，对每个像素进行计算确定最终颜色并完成输出，一般分为顶点处理、光栅化计算、纹理贴图、像素处理、输出五个步骤。GPU采用流式并行计算模式，可对每个数据行独立的并行计算。

GPU与CPU区别：CPU基于低延时设计，由运算器（ALU）和控制器（CU），以及若干个寄存器和高速缓冲存储器组成，功能模块较多，擅长逻辑控制，串行运算。GPU基于大吞吐量设计，拥有更多的ALU用于数据处理，适合对密集数据进行并行处理，擅长大规模并发计算，因此GPU也被应用于AI训练等需要大规模并发计算场景。

13 GPU可分为独立GPU和集成GPU

独立GPU：独立GPU一般封装在独立的显卡电路板上，使用专用的显示存储器，独立显卡性能由GPU性能与显存带宽共同决定。一般来讲，独立GPU的性能更高，但因此系统功耗、发热量较大。

集成GPU：集成GPU常和CPU共用一个Die，共享系统内存。集成GPU的制作由CPU厂家完成，因此兼容性较强，并且功耗低、发热量小。但如果显卡运行需要占用大量内存，整个系统运行会受限，此外系统内存的频率通常比独立显卡的显存低很多，因此一般集成GPU的性能比独立GPU更低。

14 GPU广泛运用在图显和并行计算场景

GPU拥有单一的强大并行计算能力，所以用途往往是需要大规模并行计算的场景。早期GPU多被用于2D和3D图形的计算和处理，因为图形数据的处理往往涉及到大量的大型矩阵运算，计算量大但易于并行化。近年由于大数据、人工智能发展，GPU也常常被用于需要大量重复计算的数据挖掘领域，如机器学习，深度学习等。

GPU使用场景：GPU被广泛地运用于PC、服务器、移动等领域。其中服务器GPU可做专业图形处理、计算加速、深度学习等应用，以独立GPU为主；移动端GPU主要采用集成GPU；PC根据使用用途不同，既可以搭载独立GPU，也可以使用集成GPU。

15 全球GPU巨头：NVIDIA、AMD

NVIDIA（英伟达）：创立于1993年，1999年发明了GPU，最初专注PC图形，后来拓展到密集计算领域，Nvidia利用GPU创建了科学计算、人工智能、数据科学、自动驾驶汽车、机器人技术、AR和VR的平台。 Nvidia是目前全球最大的独立GPU供应商，2020年营收1668亿美元，2021Q2 Nvidia全球独立GPU市场份额达到83%。

AMD（超威半导体）：成立于1969年，目前业内稀缺的可以提供高性能CPU、高性能独立显卡GPU、主板芯片组三大组件的半导体公司。2020年AMD营收976亿美元，其中计算和图形（包括CPU、GPU、APU等）业务营收643亿美元，2021Q2 AMD全球独立GPU市场份额达到17%。

2GPU两大应用场景：图显、计算

21 2020全球GPU市场规模接近千亿美元

2020年全球GPU市场规模达到9991亿美元。3D图像显示、人工智能深度学习的需求支撑GPU市场持续增长，根据Verified Market Research数据，2020年全球GPU市场规模达到9991亿美元，预计2028年达到15816亿美元，CAGR为59%。

测算2020年中国大陆独立GPU市场规模约235亿美元。中国是全球GPU市场重要组成部分，2020年Nvidia、AMD在中国大陆收入占比分别为233%、239%，我们假设中国大陆独立GPU市场占全球235%，测算2020年中国大陆独立GPU市场规模约为235亿美元。

22 PC GPU：2020年全球出货394亿片

PC（个人电脑）是GPU重要应用场景，根据Jon Peddie Research（JPR）数据，2020年全球GPU出货394亿片，同比增长179%。

23 PC GPU：Nvidia和AMD占据独立GPU市场

Intel领导集成GPU市场。Intel（英特尔）是全球最大的CPU制造商，2021Q2占据全球775%的x86 CPU市场，集成GPU集成在CPU中，Intel凭借CPU市场地位，占据全球PC GPU大部分市场。根据JPR数据，2021Q2 Intel占据全球683%的PC GPU市场份额，Nvidia和AMD市场份额分别为152%、165%。

Nvidia和AMD占据独立GPU市场。在独立GPU领域，Nvidia具备明显的份额领先，2021Q2市占率达到83%。2006年AMD收购ATI，2010年放弃ATI品牌后推出AMD Radeon（镭龙）独立显卡系列，2021Q2 AMD独立PC GPU市场份额17%。

24 AI服务器与加速芯片

AI服务器：通常搭载GPU、FPGA、ASIC等加速芯片，利用CPU与加速芯片的组合可以满足高吞吐量互联的需求，为自然语言处理、计算机视觉、机器学习等AI应用场景提供强大的算力支持，支撑AI算法训练和推理过程。

AI加速芯片：由于CPU并不适合大规模并行计算，因此需要加速芯片执行AI算法，目前AI加速芯片主要包括图形处理器（graphics processing unit，GPU）、现场可编程门阵列（field-programmable gate array，FPGA）、专用集成电路（application specific integrated circuits，ASIC）、神经拟态芯片等。

25 GPU是AI服务器首选加速方案

服务器是AI核心基础设施。根据IDC数据，2020年中国AI基础设施市场规模为393亿美元，同比增长268%，并将在2024年达到780亿美元，其中2020年服务器市场规模占AI基础设施的87%以上，承担着最为重要的角色。

互联网行业是AI服务器最大采购行业。根据IDC数据，2020年上半年，互联网占整体加速计算服务器市场近60%的份额，同比增持超过100%；政府行业和服务业分别依次位居第二位和第三位。

GPU服务器是AI加速方案首选。IDC预计2021年中国GPU服务器占比919%左右的市场份额，是数据中心AI加速方案首选。根据IDC数据，2019年中国GPU服务器市场规模达到20亿美元，预计2024年将达到64亿美元。

26 AI服务器通常配置多个GPU芯片

GPU加速服务器能够提供优秀的浮点计算能力，从容应对高实时、高并发的海量计算场景，例如深度学习、科学计算、3D动画渲染、CAE等应用场景。

3NVIDIA：全球GPU巨头

31 全球GPU巨头

Nvidia成立于1993年，1999年上市，市值近10年增长超过83倍，近6年增长超过49倍。截至2021年11月5日，Nvidia总市值7438亿美元，总市值美股排名第七，是目前全球市值最大的半导体公司。（报告来源：未来智库）

32 三大因素推动地位提升

技术革新、场景拓展、外延并购，Nvidia引领全球GPU发展。

GPU架构：Nvidia坚持每2-3年推出一代新的GPU架构，持续保持技术领先，新的Ampere已经采用7nm工艺；应用场景：从最初图形处理到通用计算，再到AI深度学习和自动驾驶，Nvidia不断推动GPU应用场景的突破；外延并购：2000-2008年Nvidia密集收购额多家公司，涵盖显卡、图形处理、半导体等多个领域，2020年宣布计划收购ARM。

33 近年业绩高速增长

Nvidia产品主要分为两大类：图形处理、计算&网络。下游市场包括游戏、专业可视化、数据中心、汽车四大类。

2020年Nvidia营收1668亿美元（yoy+527%），净利润433亿美元（yoy+549%），其中图形处理业务营收983亿美元，计算&网络业务营收684亿美元。除去2019年游戏市场需求波动造成业绩下滑外，Nvidia近5年营收、利润均保持较快增长。

得益于基于Ampere架构新GPU产品带动游戏业务高增，以及数据中心对算力需求旺盛，2021上半年Nvidia营收、净利润快速增长。

34 游戏是最大市场，数据中心市场增速较快

Nvidia下游市场分为四类：游戏、专业可视化、数据中心、汽车，各市场重点产品如下：

游戏：GeForce RTX/GTX系列GPU（PCs）、GeForce NOW（云游戏）、SHIELD（游戏主机）；专业可视化：Quadro/RTX GPU（企业工作站）；数据中心：基于GPU的计算平台和系统，包括DGX（AI服务器）、HGX（超算）、EGX（边缘计算）、AGX（自动设备）；汽车：NVIDIA DRIVE计算平台，包括AGX Xavier（SoC芯片）、DRIVE AV（自动驾驶）、DRIVE IX（驾驶舱软件）、Constellation（仿真软件）。

35 计算业务驱动高成长

计算业务是Nvidia成长的主要驱动力：数据中心已成规模，智能汽车将进入收获期。

在数据中心市场，Nvidia拥有芯片、硬件、硬件的全栈布局。得益于全球AI应用场景的快速增加，对算力的需求飙升。是Nvidia成长最快的市场，2020年营收达到约6696亿美元，近4年CAGR达到685%，远高于游戏市场的176%。2020年Nvidia数据中心市场营收占比已经超过40%，预计未来仍将继续提升。

在智能汽车市场， Nvidia形成了全栈式自动驾驶解决方案。AGX Xavier芯片于2018年开始出货，下一代自动驾驶芯片Orin计划用于2022年量产，算力将达到254TOPS，目前已经获得蔚来、理想、沃尔沃、奔驰等多个整车厂定点项目。我们认为2022年高阶自动驾驶汽车或将集中落地，Nvidia自动驾驶将进入收获期。

36 中国大陆收入贡献提升

Nvidia中国大陆收入快速增长。2020年Nvidia来自中国大陆收入3886亿美元，同比增长423%，近4年CAGR达到314%，同期Nvidia整体营收CAGR为246%。

Nvidia中国大陆收入占比呈上升趋势。2020年Nvidia中国大陆收入占比达到233%，相比于2016年的189%提升44pct，2021上半年Nvidia中国大陆收入占比256%，上升趋势明显。

我们预计中国大陆占比仍将提升。图显业务层面，人均收入提升将带动PC需求增加；计算业务层面，目前中国大陆在AI算法、应用层面具有领先优势，自动驾驶场景也将率先得到释放。

4景嘉微：国产GPU领军

41 国内唯一商用GPU公司

景嘉微成立于2006年，公司主营业务分为图形显控、小型专用化雷达、GPU芯片三类。其中图显、雷达产品主要面向军用市场，GPU芯片产品包括JM5400、JM7200，其中JM5400主要应用于公司图显模块中，JM7200成功拓展了民用和信创市场。2021年9月，公司第三代GPU芯片JM9成功流片，目前正在进行性能测试。

42 两个系列、三款GPU量产应用

景嘉微已完成两个系列、三款GPU芯片量产应用。第一代GPU产品JM5400于2014年流片成功，主要支撑军用装备，已在国产军用飞机上实现了对ATI M9、M54、M72等芯片的替代；第二代产品JM7200于2018年8月流片成功，性能与 Nvidia的GT640显卡相近。在JM7200基础上，公司又推出

全球GPU芯片行业发展历程

在1984年之前，GPU原本只是用于图形和图像的相关运算，受CPU的调配，但随着云计算、AI等技术的发展，GPU并行计算的优势被发掘，在高性能计算领域逐渐取代CPU成为主角。1999年，NVIDIA公司在发布其标志性产品GeForce256时，首次提出了GPU的概念。2006年，NVIDIA发布了第一款采用统一渲染架构的桌面GPU和CUDA通用计算平台，使开发者能够使用NVIDIAGPU的运算能力进行并行计算，拓展了GPU的应用领域。2011年，NVIDIA发布TESLAGPU计算卡，正式将用于计算的GPU产品线独立出来，标志着GPU芯片正式进入高性能计算时代。

全球GPU芯片出货量超过46亿片/年

近些年，全球GPU技术快速发展，已经大大超出了其传统功能的范畴，除了满足目前大多数图形应用需求，在科学计算、人工智能及新型的图形渲染技术方面的技术应用日益成熟，进而推动全球GPU芯片市场的持续高速发展。

从全球GPU芯片出货量来看，根据全球知名调研机构JPR数据，从2021年各个季度来看，全球GPU芯片的季度出货量维持在1-13万片之间，2021年全年出货总量超过46亿片。

全球集成GPU芯片出货量占比超八成

GPU芯片主要可分为独立GPU(封装在独立的显卡电路板上，使用专用的显示存储器，一般来讲，其性能更高)和集成GPU(集成GPU常和CPU共用一个Die，共享系统内存)。

目前，全球集成GPU出货量占比超过八成，占据绝大部分市场份额;但从占比变化趋势来看，独立GPU的市场份额有所增长，反映出市场对高性能GPU芯片需求有所增长。

注：内环2020年q4，外环2021年q4数据。

预计2027年全球市场规模超过320亿美元

根据IC Insights数据，2015-2021年全球GPU芯片市场规模增速超过20%，2021年，全球GPU芯片市场规模超过220亿美元。

根据JPR资料，预计2022-2026年，全球GUP出货量将实现63%复合年增长，以此增长率测算2027年全球GPU芯片行业市场规模将超过320亿美元。

—— 更多本行业研究分析详见前瞻产业研究院《中国GPU芯片行业市场前瞻与投资战略规划分析报告》

深度学习是需要配置专门的GPU服务器的:

深度学习的电脑配置要求：

1、数据存储要求

在一些深度学习案例中，数据存储会成为明显的瓶颈。做深度学习首先需要一个好的存储系统，将历史资料保存起来。

主要任务：历史数据存储，如：文字、图像、声音、视频、数据库等。

数据容量：提供足够高的存储能力。

读写带宽：多硬盘并行读写架构提高数据读写带宽。

接口：高带宽，同时延迟低。

传统解决方式：专门的存储服务器，借助万兆端口访问。

缺点：带宽不高，对深度学习的数据读取过程时间长(延迟大，两台机器之间数据交换)，成本还巨高。

2、CPU要求

当你在GPU上跑深度网络时，CPU进行的计算很少，但是CPU仍然需要处理以下事情：

（1）数据从存储系统调入到内存的解压计算。

（2）GPU计算前的数据预处理。

（3）在代码中写入并读取变量，执行指令如函数调用，创建小批量数据，启动到GPU的数据传输。

（4）GPU多卡并行计算前，每个核负责一块卡的所需要的数据并行切分处理和控制。

（5）增值几个变量、评估几个布尔表达式、在GPU或在编程里面调用几个函数——所有这些会取决于CPU核的频率，此时唯有提升CPU频率。

传统解决方式：CPU规格很随意，核数和频率没有任何要求。

3、GPU要求

如果你正在构建或升级你的深度学习系统，你最关心的应该也是GPU。GPU正是深度学习应用的核心要素——计算性能提升上，收获巨大。

主要任务：承担深度学习的数据建模计算、运行复杂算法。

传统架构：提供1~8块GPU。

4、内存要求

至少要和你的GPU显存存大小相同的内存。当然你也能用更小的内存工作，但是，你或许需要一步步转移数据。总而言之，如果钱够而且需要做很多预处理，就不必在内存瓶颈上兜转，浪费时间。

主要任务：存放预处理的数据，待GPU读取处理，中间结果存放。

深度学习需要强大的电脑算力，因此对电脑的硬件配置自然是超高的，那么现在普通的高算力电脑需要高配置硬件。

GPU是图形处理单元的英文缩写。GPU也可简称为显示芯片，是显卡的核心芯片和元件。独立显卡上除了最关键的GPU以外，还有显存、散热器及各种电阻电容、连接显示器的端口等。而集成于主板或CPU的显卡一般只有GPU，采用共享物理内存作为显存。由于显卡的主要功能与性能取决于GPU，现在多数显卡往往以所用GPU的型号来命名或作为名称的一部分。目前个人电脑消费级显卡GPU主要分成英伟达（NVIDIA）和AMD两大系列，芯片巨头英特尔则主推集成于CPU核心的显卡，俗称核显，性能多处于同期低档水平。