现有的工作针对不同的架构和平台进行了多方面尝试, 主要的架构平台包括高性能 GPU 架构、 基于 PIM (processing in memory) 的架构以及专用图计算加速器 (ASIC 和 FPGA). GPU 的高并行度 与高带宽对图计算的运算加速起到了至关重要的作用; 为了减少内存的访问带来的开销, 人们设计了 各种数据格式和图算法以提高访存效率. PIM 技术让许多新兴硬件应用到图计算中, 如 HMC (hybrid memory cube), ReRAM (resistive RAM) 等, 实现访存一体化, 减少内存数据的移动传输带来的开销. 突破通用处理器的限制, 图计算专用加速器包括基于 FPGA 的设计以及专用芯片 (ASIC) 的设计, 尝 试自主设计运算流水线、访存模式等优化策略来加速图计算运算效率以及减少能耗. 本文针对图计算加速环境下不同架构平台下对于内存管理所作出的努力以及其他方面的优化方 案进行综述. 2 图计算基本介绍 本节首先介绍图计算的基本概念与图算法的特点分类, 然后总结图计算的计算特征和常见的编程 模型. 2.1 图的基本定义 图是一种由顶点 (vertices) 和连接顶点的边 (edges) 构成的数据结构, G = (V, E), 其中 V 表示顶 点集合, E 表示边的集合. e = (v i , v j ) 表示从顶点 v i 到 v j 的一条有向边. 同时, 每一个顶点与每一条 边都有属于自己的属性值. 不同的领域属性值可代表不同的含义. 如社交网络中, 顶点的属性值为个人 的热度, 而边的属性值则表示为有关联的两人之间的紧密程度. 现实中的自然图存在以下的特性.(1) 稀疏性. 顶点的平均度数很小, 数据分布比较分散, 图数据的稀疏性会导致较差的局部性数据 访问和大量的随机访问.(2) 幂律性. 幂律性是自然图的一个很常见的特征, 图数据中一小部分顶点关联着绝大部分的边. 而大部分的顶点只关联着少量的边. 图数据的幂律性会导致很严重的负载不均衡.