网站建设费用支出方案淘宝网站可以做轮播吗

张小明 2026/1/19 22:24:57
网站建设费用支出方案,淘宝网站可以做轮播吗,服装加工厂网站建设方案计划书,网站页尾模板平面内存指令将数据片段读入或写出VGPR#xff08;向量通用寄存器#xff09;#xff1b;波前#xff08;wavefront#xff09;中的每个工作项#xff08;work-item#xff09;都会独立执行此操作。与缓冲区#xff08;buffer#xff09;或图像#xff08;image…平面内存指令将数据片段读入或写出VGPR向量通用寄存器波前wavefront中的每个工作项work-item都会独立执行此操作。与缓冲区buffer或图像image指令不同平面指令不使用资源常量resource constant来定义内存表面的基地址。相反平面指令使用来自VGPR的单个平面地址此地址将内存视为单个平面内存空间进行寻址。该内存空间包括显存video memory、系统内存system memory、LDS本地数据共享内存以及暂存scratch私有内存。它不包括GDS全局数据共享内存。平面内存空间的某些部分可能不映射到任何真实内存访问这些区域会产生内存违规错误。地址所映射到的内存空间的确定由一组内存窗口memory aperture基地址和大小寄存器控制。9.1. 平面内存指令平面内存指令允许内核kernel读取或写入内存中的数据或对已存在于内存中的数据执行原子操作。这些操作通过纹理L2缓存进行。指令声明哪个VGPR保存地址32位或64位取决于内存配置哪个VGPR发送数据哪个VGPR接收数据。平面指令还使用M0寄存器如下表所述表41. 平面、全局和暂存微码格式字段位宽描述OP7操作码Opcode。可以是平面、暂存或全局指令。见下表。ADDR8保存地址的VGPR。对于64位地址ADDR包含低有效位LSBADDR1包含高有效位MSB。DATA8保存数据第一个双字Dword的VGPR。指令可使用0-4个双字。VDST8数据返回内核的目标VGPR可来自LOAD指令或GLC1的原子指令返回操作前值。SLC1系统级一致性System Level Coherent。与GLC结合使用以确定缓存策略。GLC1全局级一致性Global Level Coherent。对于原子指令GLC1表示返回操作前值0表示不返回操作前值。SEG2内存段Memory Segment0FLAT1SCRATCH2GLOBAL3保留。LDS1设置时数据在LDS和内存之间移动而不是VGPR和内存之间。仅用于全局和暂存指令对于平面指令必须为零。NV1非易失性Non-volatile。设置时读/写操作在非易失性内存上进行。OFFSET13地址偏移量。暂存、全局13位有符号字节偏移量。平面12位无符号偏移量最高位被忽略。表42. 平面、全局和暂存操作码平面操作码全局操作码暂存操作码FLATGLOBALSCRATCHFLAT_LOAD_UBYTEGLOBAL_LOAD_UBYTESCRATCH_LOAD_UBYTEFLAT_LOAD_UBYTE_D16GLOBAL_LOAD_UBYTE_D16SCRATCH_LOAD_UBYTE_D16FLAT_LOAD_UBYTE_D16_HIGLOBAL_LOAD_UBYTE_D16_HISCRATCH_LOAD_UBYTE_D16_HIFLAT_LOAD_SBYTEGLOBAL_LOAD_SBYTESCRATCH_LOAD_SBYTEFLAT_LOAD_SBYTE_D16GLOBAL_LOAD_SBYTE_D16SCRATCH_LOAD_SBYTE_D16FLAT_LOAD_SBYTE_D16_HIGLOBAL_LOAD_SBYTE_D16_HISCRATCH_LOAD_SBYTE_D16_HIFLAT_LOAD_USHORTGLOBAL_LOAD_USHORTSCRATCH_LOAD_USHORTFLAT_LOAD_SSHORTGLOBAL_LOAD_SSHORTSCRATCH_LOAD_SSHORTFLAT_LOAD_SHORT_D16GLOBAL_LOAD_SHORT_D16SCRATCH_LOAD_SHORT_D16FLAT_LOAD_SHORT_D16_HIGLOBAL_LOAD_SHORT_D16_HISCRATCH_LOAD_SHORT_D16_HIFLAT_LOAD_DWORDGLOBAL_LOAD_DWORDSCRATCH_LOAD_DWORDFLAT_LOAD_DWORDX2GLOBAL_LOAD_DWORDX2SCRATCH_LOAD_DWORDX2FLAT_LOAD_DWORDX3GLOBAL_LOAD_DWORDX3SCRATCH_LOAD_DWORDX3FLAT_LOAD_DWORDX4GLOBAL_LOAD_DWORDX4SCRATCH_LOAD_DWORDX4FLAT_STORE_BYTEGLOBAL_STORE_BYTESCRATCH_STORE_BYTEFLAT_STORE_BYTE_D16_HIGLOBAL_STORE_BYTE_D16_HISCRATCH_STORE_BYTE_D16_HIFLAT_STORE_SHORTGLOBAL_STORE_SHORTSCRATCH_STORE_SHORTFLAT_STORE_SHORT_D16_HIGLOBAL_STORE_SHORT_D16_HISCRATCH_STORE_SHORT_D16_HIFLAT_STORE_DWORDGLOBAL_STORE_DWORDSCRATCH_STORE_DWORDFLAT_STORE_DWORDX2GLOBAL_STORE_DWORDX2SCRATCH_STORE_DWORDX2FLAT_STORE_DWORDX3GLOBAL_STORE_DWORDX3SCRATCH_STORE_DWORDX3FLAT_STORE_DWORDX4GLOBAL_STORE_DWORDX4SCRATCH_STORE_DWORDX4FLAT_ATOMIC_SWAPGLOBAL_ATOMIC_SWAP无FLAT_ATOMIC_CMPSWAPGLOBAL_ATOMIC_CMPSWAP无FLAT_ATOMIC_ADDGLOBAL_ATOMIC_ADD无FLAT_ATOMIC_SUBGLOBAL_ATOMIC_SUB无FLAT_ATOMIC_SMINGLOBAL_ATOMIC_SMIN无FLAT_ATOMIC_UMINGLOBAL_ATOMIC_UMIN无FLAT_ATOMIC_SMAXGLOBAL_ATOMIC_SMAX无FLAT_ATOMIC_UMAXGLOBAL_ATOMIC_UMAX无FLAT_ATOMIC_ANDGLOBAL_ATOMIC_AND无FLAT_ATOMIC_ORGLOBAL_ATOMIC_OR无FLAT_ATOMIC_XORGLOBAL_ATOMIC_XOR无FLAT_ATOMIC_INCGLOBAL_ATOMIC_INC无FLAT_ATOMIC_DECGLOBAL_ATOMIC_DEC无上述原子指令也有_X2版本64位。9.2. 指令FLAT指令集几乎与缓冲区Buffer指令集相同但没有FORMAT格式读写操作。与缓冲区指令不同FLAT指令不能直接将数据返回到LDS只能返回到VGPRs。FLAT指令不使用资源常量V#或采样器S#但是它们需要一个SGPR对SGPR-pair来保存暂存空间信息以防任何线程的地址解析为暂存空间。详情参见暂存空间部分。在内部FLAT指令同时作为LDS指令和缓冲区指令执行因此它们会递增VM_CNT和LGKM_CNT计数器并且只有在两者都被递减后才被认为完成。无法事先确定FLAT指令是否仅使用LDS或TA内存空间。9.2.1. 顺序性平面指令之间可以乱序完成。如果一条平面指令在纹理缓存中找到其所有数据而下一个平面指令在LDS中找到其所有数据则第二条指令可能先完成。如果两次取数返回数据到同一个VGPR则结果未知。9.2.2. 重要的时序考虑由于FLAT加载的数据可能来自LDS或纹理缓存并且这些单元具有不同的延迟因此在VM_CNT和LGKM_CNT计数器方面存在潜在的竞态条件。因此在FLAT指令之后唯一合理的S_WAITCNT值是零。9.3. 寻址FLAT指令支持64位和32位寻址。地址大小使用模式寄存器PTR32设置并且每个波wave存储该值的本地副本。用于窗口检查的地址在32位和64位模式下有所不同但此处不涵盖此内容。64位地址的存储方式为低有效位LSB存储在ADDR指定的VGPR中高有效位MSB存储在ADDR1指定的VGPR中。对于暂存空间纹理单元从VGPR获取地址并执行以下操作Address VGPR[addr] TID_in_wave * Size - private aperture base (in SH_MEM_BASES) offset (from flat_scratch)9.4. 全局指令全局指令类似于平面指令但程序员必须确保没有线程访问LDS空间因此全局指令不使用LDS带宽。全局指令提供两种寻址类型内存地址 VGPR地址 指令偏移量。内存地址 SGPR地址 VGPR偏移量 指令偏移量。地址组件的大小取决于ADDRESS_MODE32位或64位指针。VGPR偏移量为32位。这些指令还允许数据直接在LDS和内存之间移动而无需经过VGPRs。由于这些指令不访问LDS仅使用VM_CNT而不使用LGKM_CNT。如果全局指令尝试访问LDS则指令返回MEM_VIOL内存违规。9.5. 暂存指令暂存指令类似于平面指令但程序员必须确保没有线程访问LDS空间并且内存空间是交错swizzled的。因此暂存指令不使用LDS带宽。暂存指令还支持多双字访问和非对齐访问尽管非对齐访问速度较慢。暂存指令使用以下寻址方式内存地址 flat_scratch.addr swizzle(V/SGPR偏移量 指令偏移量, 线程ID)偏移量可以来自SGPR或VGPR并且是32位无符号字节。地址组件的大小取决于ADDRESS_MODE32位或64位指针。VGPR偏移量为32位。这些指令还允许数据直接在LDS和内存之间移动而无需经过VGPRs。由于这些指令不访问LDS仅使用VM_CNT而不使用LGKM_CNT。暂存指令不可能访问LDS因此不会进行错误或窗口检查。9.6. 内存错误检查TA纹理数组和LDS都可以报告由于错误地址导致的错误。这可能在以下情况下发生无效地址在任何窗口之外写入只读表面数据未对齐地址越界LDS访问地址超出范围[0, MIN(M0, LDS_SIZE)-1]暂存访问地址超出范围[0, scratch-size -1]对于具有错误地址的线程的策略是超出此范围的写入不会写入值读取返回零。来自LDS或TA的地址错误通过它们各自的指令完成总线作为MEM_VIOL返回。这会设置波wave的MEM_VIOL TrapStatus位并在相应的EXCPEN位设置时导致异常trap。9.7. 数据FLAT指令可以在VGPRs和/或内存中使用零到四个连续的双字数据。DATA字段确定哪些VGPR如果有提供源数据而VDST VGPRs保存返回数据如果有。不进行数据格式转换。9.8. 暂存空间私有暂存空间线程私有内存是由窗口寄存器定义的内存区域。当地址落在暂存空间中时硬件会自动执行额外的地址计算。内核必须提供额外信息以FLAT_SCRATCH寄存器的形式以便进行此计算。FLAT_SCRATCH地址会随着每个FLAT请求自动发送。FLAT_SCRATCH是一个64位字节地址。着色器通过将两个独立的值相加来构成该值基地址可以通过初始化的SGPR传递或通过常量缓冲区传递和每波分配偏移量也在SGPR中初始化。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

互联网人工智能重庆百度推广关键词优化

HunyuanVideo-Foley音效生成引擎的技术架构剖析:从输入到输出全流程 在短视频日均产量突破千万条的今天,一个现实问题摆在内容创作者面前:如何让每一段画面都“声临其境”?传统音效制作依赖人工逐帧匹配环境音、动作音效和背景音乐…

张小明 2026/1/17 22:14:52 网站建设

设计企业网站多少钱wordpress 上传到七牛

【PYTHON-YOLOV8N】如何自定义数据集一、核心前提:明确 YOLO 数据集格式二、步骤 1:整理原始数据(图片)1. 文件夹结构(推荐)2. 数据收集/筛选三、步骤 2:标注数据(生成 YOLO 格式标签…

张小明 2026/1/17 22:14:56 网站建设

网站建设综合案例做网站到底能不能赚钱

5分钟掌握Magisk核心功能:新手必知的3大故障排查技巧 🚀 【免费下载链接】Magisk The Magic Mask for Android 项目地址: https://gitcode.com/GitHub_Trending/ma/Magisk Magisk作为Android系统定制的重要工具,其核心功能包括root权限…

张小明 2026/1/17 22:14:56 网站建设

湛江建设网官方网站wordpress内容

第一部分:基础概念 1. JavaScript 执行环境 JavaScript 是单线程的,这意味着它一次只能执行一个任务。为了处理异步操作,JavaScript 使用事件循环机制。 2. 核心组件 调用栈(Call Stack) :执行同步代码的地…

张小明 2026/1/17 22:14:57 网站建设

门户网站建设报告哦pageadmin怎么样

在化工、制药、污水处理、能源等高危工业场景中,有毒有害气体的无色无味往往意味着致命风险。一次微小的氨气(NH₃)泄漏,或是一次硫化氢(H₂S)浓度的悄然攀升,都可能引发中毒、爆炸甚至群死群伤…

张小明 2026/1/19 22:02:12 网站建设

html5线上运营网站win2003 做网站服务器

wx-calendar微信小程序日历组件完整使用教程 【免费下载链接】wx-calendar 原生的微信小程序日历组件(可滑动,标点,禁用) 项目地址: https://gitcode.com/gh_mirrors/wxcale/wx-calendar 微信小程序日历组件wx-calendar作为…

张小明 2026/1/19 17:49:17 网站建设