b2科目四模拟试题多少题驾考考爆了怎么补救
b2科目四模拟试题多少题 驾考考爆了怎么补救

图像处理的GPU加速技术,GPU的数字图像并行处理及基于GPUknn(2)

电脑杂谈  发布时间:2021-05-26 19:01:17  来源:网络整理

使用了两组实验数据,如图2所示:第一组是:新加坡某些地方的QucikBird卫星图像,大小为(像素);第二组是:黄河小浪底部分的Spot4。卫星图像,大小为(像素)。图3. 2测试数据1图3. 3测试数据2邵阳大学毕业设计(论文)38为了对多组数据进行比较测试,首先对原始图像数据进行预处理,并获得2048204的大小通过切割。 k46] 1024102 4、 52151 2、 25625 6、 128128测试数据。使用10张不同尺寸的预处理图像进行卷积运算比较实验,分别运行卷积平滑和卷积锐化的CPU和GPU程序,并记录处理时间。实验中使用的平滑卷积核h1是公式(2),锐化卷积核h2测试结果和分析图3. 4显示了图像数据两个512512的平滑锐化实验的处理结果,图3. 5 GPU加速效率对比图图3. 4卷积平滑图像邵阳学院毕业设计(论文)39图3. 5卷积锐化图像3. 6(五)卷积GPU加速效率对比图3.如图5所示,随着图像的增加,特别是卷积核的增大,GPU的速度效应变得更加明显,例如,对于20482048大小的图像,卷积运算的55加速度最高,比率达到了8倍。

但是,当图像数据较小时,由于OpenGL初始化和纹理,需要花费很多时间来加载数据,这使得GPU并行处理的优势消失了,甚至不如CPU处理快。 。简要介绍了GPU的并行性和数字图像处理算法的并行级别,提出了像素级图像处理的GPU并行化实现方法,并介绍了其基本过程和关键技术:数据加载,反馈和计算结果的保存和保存。其他问题将进行详细讨论。最后,图像平滑和锐化的卷积运算证明了GPU在数字图像并行处理中的强大优势。邵阳学院毕业设计(论文)34基于GPU的knn设计4. 1 KNN程序参数设置公式(1)中显示了KNN滤波器函数表达式。Ω(p)的大小与图像的大小有关。 ,P为特定像素,一般来说,Ω(p)需要5x5的去噪效果。在实验程序中,使用7x7进行计算,并且由于程序中的窗口Radim值和Ω(的边长) [p8] 2 GPU平台KNN设计4. 2. 1元素复制内核功能设计内核功能的工作原理是:将设计为内核凯末尔用于并行数据处理的CUDA程序发送到设备上的网格以执行,该网格包含多个块,每个块都处于打开状态。一个多处理器,运行时,每个块执行几个线程。

-特定的配置构成了内核程序的执行环境,该环境是在程序启动时指定的。元素复制内核函数的声明如下:-global-voidcopy(tcolor * dst,int imageH)_global限定符声明的函数将用作内核动态函数,在主机上调用并在GPU上执行。 NVCC会将这部分并联至GPU进行并行数据计算。复制内核函数将图像的像素并行发送到GPU,复制内核函数的调用如下:int idivup(int a,int b){return((a%b)/ = 0) ?(a / b + 1) :( ab):} dim3格网(idivup(imagew,blockdim_x),idivup()imageh,blockdim); dim3线程(llockdim_x,blockdim_y); copy(d-dst,imagew,imageh) ;其中,grid * grid。y等于发送的块数,即iDi-vVp(imageW,邵阳大学设计(论文)35 BLOCKDIM_X)* iDivUp(imageH thread.x * thread等于该数目每个块(即每个块)中的线程数(块中有BLOCKDIM_X * BLOCKDIM_Y = 8x8 = 64个线程)。

4. 2. 2 KNN内核函数设计KNN内核函数的工作原理与复制内核函数基本相同,不同之处在于复制内核函数除了将像素复制到全局像素外不执行其他处理。记忆; KNN内核函数需要遵循KNN滤波函数需要对像素进行降噪,然后才能将由某个像素的降噪生成的新像素值写入全局内存。 KNN过滤器函数的声明如下:-global-void knn(tcolor * dst,int imagew,int imageh,float noise,flost lerpc); KNN的调用如下:Int idivup(int a,int Dim3grid()idivup(imagew,blocdim_x),idivup()imageh,block_y); dim3 thead(blockdim-X,blockdim_Y); knn(d-dst,imagew,imageh,1. 0t /(knnnoise * knnnoise),lerp 4. 2. 3BMP图片加载主机代码设计BMP图片加载代码是在CPU上运行的主机代码。读取24深度BMP图像的关键是读取BMP图像的两个结构文件BMPHeader和BMPInfoHeader,其中包含图像处理所需的信息,例如BMPInfoHeader.width是图像的宽度,以及BMP-InfoHeader.height是图像的高度。

BMPHeader结构文件的声明如下:Typedef struct {邵阳学院毕业设计(论文)36短类型;整数大小;简短的保留1;简短的保留2; Int sffset; } bmpheader; BMPInfoHeader结构文件的声明如下:Typedef struct {Int width;整数高度; Intypelsperometer; Int clrlmportent; } bmpinfoheader; BMP图像读取的关键代码设计如下,在确认指针位置后,分别读取RGB三色值3次。 Faeek(fd,hdr.offset-sizeof(hdr)-sizeof(infohdr),seek_cur);对于(y = 0; y


本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/shumachanpin/article-378292-2.html

相关阅读
    发表评论  请自觉遵守互联网相关的政策法规,严禁发布、暴力、反动的言论

    热点图片
    拼命载入中...