logo
  • 新手入门
  • 用户指南
  • API 参考
  • 开发者指南
  • 论坛
  • 官网
  • 如何安装 MegEngine
  • 用户迁移指南
  • 常见问题汇总

模型开发(基础篇)

  • 深入理解 Tensor 数据结构
  • 使用 Functional 操作与计算
  • 使用 Data 构建输入 Pipeline
  • 使用 Module 定义模型结构
  • Autodiff 基本原理与使用
  • 使用 Optimizer 优化参数
  • 保存与加载模型(S&L)
  • 使用 Hub 发布和加载预训练模型

模型开发(进阶篇)

  • 通过重计算节省显存(Recomputation)
  • 分布式训练(Distributed Training)
  • 量化(Quantization)
  • 自动混合精度(AMP)
  • 模型性能数据生成与分析(Profiler)
  • 使用 TracedModule 发版
  • 即时编译(JIT)

推理部署篇

  • 模型部署总览与流程建议
  • 使用 MegEngine Lite 部署模型
  • MegEngine Lite 使用接口
  • 使用 MegEngine Lite 部署模型进阶
    • 性能优化
      • 输入输出内存拷贝优化
      • 执行性能优化
    • 内存优化
    • 减少 MegEngine Lite 体积
    • 模型加解密和打包(可选)
    • CV 算法示例
  • 使用 Load and run 测试与验证模型

工具与插件篇

  • 参数和计算量统计与可视化
  • RuntimeOpr 使用说明
  • 自定义算子(Custom Op)
On this page
  • 文档目录
Edit this page

性能优化¶

文档目录¶

  • 输入输出内存拷贝优化
    • Device IO 优化
    • 输入输出拷贝优化
  • 执行性能优化
    • 基本的配置代码
    • weight preprocess 优化
    • Fast-Run 优化
    • Format 优化
    • Record 优化:
    • 多线程优化:
    • CPU Inplace 优化
    • JIT 优化
    • 总结

上一页

使用 MegEngine Lite 部署模型进阶

下一页

输入输出内存拷贝优化