提速还能不掉点!深度解析 MegEngine 4 bits 量化开源实现

4 bits 量化模型落地已被验证,MegEngine 挑战精度、速度优化双极限。

TracedModule: 更友好的模型表示方案,模型训练到部署的桥梁

TracedModule 用于脱离模型源码对模型进行训练、量化、图手术和模型转换,它是模型训练到部署之间的桥梁。

MegEngine Inference 卷积优化之 Im2col 和 winograd 优化

主要介绍 Im2col+matmul 卷积及 Winograd 卷积中的一些进一步优化的技术手段,通过这些方法可进一步加速卷积计算的性能。

MegPeak:让你更懂你的处理器

MegPeak 能够使得开发人员轻松获得目标处理器的内在的详细信息,辅助进行对代码的性能评估,以及优化方法设计。

ARM 算子性能优化上手指南

本文主要介绍 arm 算子性能优化的常用思路,为一个入门级的参考,以 ARM Cortex a55 上的 GaussianBlur 优化为例展开。

全局图优化:提升 MegEngine 模型推理性能的又一神器

深度学习模型的推理性能通常是大家关注的重要指标,如果能通过从整体上优化 Tensor Format 来提升模型整体推理性能,会怎样?

实录 | MegEngine 大 Kernel 卷积工程优化实践

本篇文章将介绍MegEngine 大 kernel depthwise 具体的优化思路和工程实践。

圆桌实录 | 为什么不约而同选择了大 Kernel

在 3.19 日的 “Large Kernel Makes CNN Great Again” 专题 Meetup 中,我们组织了一次圆桌讨论,本篇为文字实录,enjoy~

凭什么 31x31 大小卷积核的耗时可以和 9x9 卷积差不多?| 文末附 meetup 回顾

卷积网络的 kernel size 可以多大?答案是:25x25 就很好,31x31 甚至更好。

热门标签
点击即可选中标签,再次点击取消选中
热门标签
提速还能不掉点!深度解析 MegEngine 4 bits 量化开源实现

4 bits 量化模型落地已被验证,MegEngine 挑战精度、速度优化双极限。

TracedModule: 更友好的模型表示方案,模型训练到部署的桥梁

TracedModule 用于脱离模型源码对模型进行训练、量化、图手术和模型转换,它是模型训练到部署之间的桥梁。

MegEngine Inference 卷积优化之 Im2col 和 winograd 优化

主要介绍 Im2col+matmul 卷积及 Winograd 卷积中的一些进一步优化的技术手段,通过这些方法可进一步加速卷积计算的性能。

MegPeak:让你更懂你的处理器

MegPeak 能够使得开发人员轻松获得目标处理器的内在的详细信息,辅助进行对代码的性能评估,以及优化方法设计。

ARM 算子性能优化上手指南

本文主要介绍 arm 算子性能优化的常用思路,为一个入门级的参考,以 ARM Cortex a55 上的 GaussianBlur 优化为例展开。

全局图优化:提升 MegEngine 模型推理性能的又一神器

深度学习模型的推理性能通常是大家关注的重要指标,如果能通过从整体上优化 Tensor Format 来提升模型整体推理性能,会怎样?

实录 | MegEngine 大 Kernel 卷积工程优化实践

本篇文章将介绍MegEngine 大 kernel depthwise 具体的优化思路和工程实践。

圆桌实录 | 为什么不约而同选择了大 Kernel

在 3.19 日的 “Large Kernel Makes CNN Great Again” 专题 Meetup 中,我们组织了一次圆桌讨论,本篇为文字实录,enjoy~

凭什么 31x31 大小卷积核的耗时可以和 9x9 卷积差不多?| 文末附 meetup 回顾

卷积网络的 kernel size 可以多大?答案是:25x25 就很好,31x31 甚至更好。

MegEngine Windows Python wheel 包减肥之路

本文将重点讲述在支持 MegEngine Windows Python wheel 过程中遇到的问题以及解决问题的流程。

MegEngine 端上训练:让 AI 懂你,更能保护你

MegEngine 既可以在 GPU 上进行训练,又可以在移动设备上进行推理,那两者结合一下,是不是可以在移动设备上进行训练呢?

深入理解混合精度训练:从 Tensor Core 到 CUDA 编程

本文会结合代码实例,帮助读者对框架层面使用 Tensor Core 进行训练加速的细节乃至 CUDA 编程有一些基本的认识。

展开更多