OpenCL 通用编程与优化(13)

本文博客介绍了内核性能优化的剩余内容,即通用内存地址空间和已命名地址空间、子组、联合使用、结构的使用等。

Qualcomm OpenCL

时间:2023-03-01 09:59:15

OpenCL 通用编程与优化(12)

继上文,本文博客继续介绍更多关于内核优化的细节。如回路展开、避免分支分化、避免使用size_t等。

Qualcomm OpenCL

时间:2023-02-28 10:10:02

OpenCL 通用编程与优化(11)

继前文顶级优化技巧和内存优化技巧重叠,本文博客将介绍更多关于内核优化的细节。

Qualcomm OpenCL

时间:2023-02-27 09:42:49

OpenCL 通用编程与优化(10)

本文博客主要介绍如何提高GPU的L1/L2缓存使用率、CPU缓存操作,以及降低电力/能源消耗的最佳实践。

Qualcomm OpenCL

时间:2023-02-27 09:44:27

OpenCL 通用编程与优化(9)

在以前的部分中,我们讨论了有关如何使用其他类型内存的一般指南。在本节中,我们将审查有关memory load/store的性能至关重要的一些关键点。

Qualcomm OpenCL

时间:2023-02-23 11:10:35

OpenCL 通用编程与优化(8)

OpenCL支持使用芯片外系统RAM的缓冲区和图像对象。与存储在系统RAM中的简单一维数据数组的缓冲区对象相比,图像对象是一个不透明的内存对象,其中开发人员不知道底层数据是如何存储的。当创建一个图像对象时,软件以特定的方式排列数据,以便GPU有效地访问。使用它们的最佳方法是不同的,并将在下面的章节中进行讨论。

Qualcomm OpenCL

时间:2023-02-22 09:39:16

OpenCL 通用编程与优化(7)

本章为Adrenogpu提供了一些顶级的OpenCL优化技巧,更多的细节和其他信息将在下面的章节中描述。本章中的所有建议都应该具有最高的优先级,开发人员在进行内核优化时应该在尝试其他建议之前尝试它们。

Qualcomm OpenCL

时间:2023-02-21 10:10:19

OpenCL 通用编程与优化(6)

本章提供了对OpenCL应用程序优化的高级概述。更多细节在下面的几章。本文博客主要介绍对OpenCL应用程序的优化可能具有挑战性。它通常需要比最初的开发更多的努力。

Qualcomm OpenCL

时间:2023-02-20 10:11:34

OpenCL 通用编程与优化(5)

给定一个应用程序,准确地分析其性能至关重要。以下各节将讨论两种常用方法,CPU 定时器和 GPU 定时器,以及它们的主要区别。

Qualcomm OpenCL

时间:2023-02-17 10:07:59

OpenCL 通用编程与优化(4)

本章简要讨论了 Adreno OpenCL 应用程序开发的一些基本要求,然后是如何调试和分析应用程序。

Qualcomm OpenCL

时间:2023-02-16 10:06:27

每页显示 共1412条数据 < 1 2 3 4 ...142 >      到第 GO

Qualcomm 解决方案

 

XR

Qualcomm XR专区是 Qualcomm和CSDN联合建立的聚焦增强现实(AR)、虚拟现实(VR)等技术的技术专区。本专区将为开发者打造一流的开发环境,提供丰富的技术支持,和业界资讯,以及最全面的下载资料。让开发者感受非凡移动体验、带来身临其境的移动享受、感受精彩生活、无限接近逼真视觉提供支持,打造一个全面的移动开发者技术服务社区。

了解更多

SDK 下载

本版块下载 SDK,只需简单注册,就可轻松下载。