唐斌
,
龙文
液晶与显示
doi:10.3788/YJYXS20163107.0714
本文提出一种基于 GPU+CPU 的快速实现 Canny 算子的方法.首先将算子分为串行和并行两部分,高斯滤波、梯度幅值和方向计算、非极大值抑制和双阈值处理在 GPU 中完成,将二维高斯滤波分解为水平方向上和垂直方向上的两次一维滤波从而降低计算的复杂度;然后使用 CUDA 编程完成多线程并行计算以加快计算速度;最后使用共享存储器隐藏线程访问全局存储的延迟;在 CPU 中则使用队列 FIFO 完成边缘连接.仿真测试结果表明:对分辨率为1024×1024的8位图像的处理时间为122 ms,相对应单独使用 CPU 而言,加速比最高可达5.39倍,因此本文方法充分利用了GPU 的并行性的特征和 CPU 的串行处理能力.
关键词:
CANNY
,
CUDA
,
GPU
,
加速
朱兵
,
付飞蚺
液晶与显示
doi:10.3788/YJYXS20132801.0127
为满足影像引导手术(IGS)中高分辨率、海量数据的实时渲染,提出一种基于GPU的虚拟内窥镜场景实时绘制算法.该算法针对虚拟内窥镜渲染数据的特点(管腔数据占总数据比例小,5%左右),首先对图像进行自动分割,得到管腔组织的分割数据;仅将分割后的数据一次载入图像显存,利用光线投射算法进行渲染,并在多GPU负载方面做了优化.充分利用GPU渲染和并行计算的能力,实现了海量数据(1024×1024×1024)的实时渲染.
关键词:
虚拟内窥镜
,
GPU
,
光线投影
,
负载平衡
李大禹
液晶与显示
doi:10.3788/YJYXS20163105.0491
为了满足4 m天文望远镜液晶自适应光学系统的波前处理要求,研究了基于多GPU的波前处理器.介绍了液晶自适应光学波前处理方法.分析了用于匹配4 m望远镜的哈特曼探测器数目、Zernike模式数和液晶校正器驱动单元数.详细论述了多GPU下波前处理方法,包括:单GPU下计算斜率;按列分块法拟合Zernike系数;Zernike对称性算法和按行分块法计算液晶校正器灰度图.最后,分析了匹配4 m望远镜的液晶自适应光学系统的残余误差传递函数,并由此模拟了残余误差传递函数的幅频响应.实验结果表明,斜率计算延迟18 μs,Zernike系数拟合延迟39 μs,校正器灰度图计算延迟114 μs.多GPU下总的波前处理延迟171 μs,小于哈特曼探测器采样时间500 μs,液晶自适应光学系统-3 dB残余误差抑制带宽可达53 Hz.满足4 m天文望远镜的应用要求.
关键词:
图形处理器
,
液晶
,
自适应光学