CANN/asc-devkit矩阵计算实践
2026/6/4 22:56:50 网站建设 项目流程

Matrix Compute Practices 样例介绍

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

概述

基于 Matrix Compute API 的矩阵计算优化样例,通过<<<>>>直调方式,介绍 Matmul 与 MxFP4 Matmul 在高阶 API、基础 API、Tensor API 场景下的高性能实践。

样例列表

目录名称功能描述支持的产品
matmul_high_performanceMatmul 高阶 API 递进式性能优化样例,展示多核切分、MDL、L1/L2 Cache、常量 tiling、UnitFlag 等优化方法。Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
matmul_basic_api_high_performanceMatmul 基础 API 最佳实践样例,基于静态 Tensor 编程展示基础 API 下的高性能实现细节。Ascend 950PR/Ascend 950DT
Atlas A3 训练系列产品/Atlas A3 推理系列产品
Atlas A2 训练系列产品/Atlas A2 推理系列产品
matmul_mxfp4_high_performanceMxFP4 Matmul 高阶 API 性能调优样例,展示常量化 tiling 与 scale 数据搬运优化方法。Ascend 950PR / Ascend 950DT
matmul_mxfp4_basic_api_high_performanceMxFP4 Matmul 基础 API 高性能样例,基于静态 Tensor 编程展示已验证的基础 API 实现路径。Ascend 950PR / Ascend 950DT
matmul_mxfp4_tensor_api_high_performanceMxFP4 Matmul Tensor API 高性能样例,基于静态 Tensor 编程展示已验证的 Tensor API 实现路径。Ascend 950PR / Ascend 950DT

【免费下载链接】asc-devkit本项目是CANN 推出的昇腾AI处理器专用的算子程序开发语言,原生支持C和C++标准规范,主要由类库和语言扩展层构成,提供多层级API,满足多维场景算子开发诉求。项目地址: https://gitcode.com/cann/asc-devkit

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询