- 创新“135”工作法,打造“讲政治、提素质、强本领、严纪律”党建品牌行政公文范文
- 学校党总支纪检年度工作总结行政公文范文
- 学生会的纪检部工作总结行政公文范文
- 回顾这一年来的纪检工作总结范本行政公文范文
- 纪检信访工作总结行政公文范文
- 创新“135”工作法,打造“讲政治、提素质、强本领、严纪律”党建品牌行政公文范文
- 小论文——为新中国巨变而作行政公文范文
- 在纪检监察工作中坚持和运用习近平法治思想行政公文范文
- 关于党员分散型基层党组织党建工作探究行政公文范文
- 定西扶贫精神:续写新时代“三苦精神”新篇章行政公文范文
- 强党建促生产的制度安排及实践运用行政公文范文
- 如何加强新形势下基层党支部建设行政公文范文
- 对加强邮政企业基层党建工作的思考行政公文范文
- 后疫情时代全球化创新性发展的逻辑思考行政公文范文
- 关于如何在行业有效开展廉政风险防控的几点思考行政公文范文
- “以案促改深化年”开展情况总结行政公文范文
- 202_年党风廉政建设和反腐败工作总结行政公文范文
- 违规借贷、违规收送礼品礼金、私车公养专项整治活动总结行政公文范文
- 中共xxx党组202_年落实全面从严治党主体责任情况报告行政公文范文
- 落实党风廉政建设“两个责任”工作总结行政公文范文
- 202_年学校纪检监察工作总结行政公文范文
- 村级202_年上半年党风廉政工作总结行政公文范文
- 落实全面从严治党、党风廉政建设和反腐败工作主体责任清单行政公文范文
- 国企巡查整改进展情况报告行政公文范文
- 关于贯彻落实《中国共产党宣传工作条例》、《党委(党组)意识形态工作责任制实施办法》相关责任情况的工作总结行政公文范文
- 国家与社会关系的基本原理是马克思主义国家学说的真髓行政公文范文
- 成熟马克思异化观疏证行政公文范文
- 入党政审证明材料父母行政公文范文
- 纪检部工作月总结行政公文范文
- 纪检信访工作总结行政公文范文
随着计算机和集成电路技术的发展,尤其是集成电路的集成度和并行度的提高,图形硬件的更新速度越来越快,图形处理器 ( Graphic Processing Unit, GPU) 自1999年由NVIDIA公司提出以来, 其发展速度是CPU的三倍多。多流水线结构、向量处理特性以及32位IEEE标准浮点精度的实现使得它对于计算密集型的科学应用有非常大的吸引力,成 为通用计算的一个有效并行平台。AMD、NVIDIA和Intel都有各自独立的GPU通用计算计划。以GeForce8为代表的可编程GPU发布后, GPGPU( General Purpose GPU)进入了一个高速发展的全新时代, 显卡厂商NVIDIA更是推出了专门通用计算平台— CUDA( Compute Unified Device Architecture), 极大地提高了GPU的可编程性,使得个人计算机实现高性能并行计算变成可能。
提供良好的高性能计算开发环境,一直是学术界和工业界所追求的目标。开发环境既包括并行计算机体系结构、计算机网络拓扑结构等硬件环境,也包括并行程序的开发模式,网络通信协议和通信方式等软件环境。并行算法研究要以硬件(即并行计算机)为依托,并行计算机性能的发挥要以优秀并行算法的实现为依托。最终目的是在研究中形成完备的“理论-设计-实现-应用”的一体化并行计算研究体系。
如今,GPU早已不再满足于只做3D图形计算,慢慢的也在向着并行优化计算和高精度浮点数计算等方面发展,对于一些问题上,GPU有着比CPU高出几十倍甚至几百倍的运算性能。高性能计算、数据中心、互联网、云计算、大数据、深度学习……只要是需要强大计算能力与加速功能的地方,都能看到GPU的身影。而这些需要高性能计算的领域,往往向着并行化和运算加速方向发展。
矩阵运算是在科学计算和实际数学分析中常用的数学运算,而且矩阵乘法和矩阵求逆更是在计算中最常遇见且耗时较大的运算。即便在算法优化的情况下,稠密矩阵的乘法和求逆运算依然有O(n^3)的复杂度。这些算法实现起来不仅复杂,而且需要大量的内存空间开销。而矩阵的常规运算中存在大量的重复并行运算,可以充分发挥GPU多核计算、并行实现、流水优化的核心优势。使用GPU并行加速也成为大规模稠密矩阵的运算一个新的方向。