AI 模型编译器 MegCC 开源，解决推理引擎体积问题

如果想在 V2EX 获得更好的推广效果，欢迎了解 PRO 会员机制：
https://www.v2ex.com/pro/about

如果你经常使用铜币置顶主题，持有 V2EX Solana Token 会在每日签到时获得额外铜币：
https://www.v2ex.com/solana

This topic created in 1273 days ago, the information mentioned may be changed or developed.

目前社区已经有多个移动端深度学习推理框架，如：NCNN 、MNN... 这些推理引擎都给社区的用户带来了在移动端上部署深度学习非常多的便利，但是他们也都有一个共性问题：随着不断地迭代以及性能优化，运行时库会逐渐的增大，特别是在不同算子 fuse 的时候，会导致非常多的长尾算子，这就会增大我们 App 或者 SDK 的体积。

为了解决这个问题，由 MegEngine 团队开源的 MegCC 创新使用模型预编译的方案，生成模型推理必要的代码，去除掉了和模型推理无关的代码，因此极大程度上减少了推理引擎的体积。主要方法是：

将传统框架运行时的必要步骤：计算图优化、Kernel 选择、内存分配都移到编译时，从而最大程度上减少了 Runtime 时的二进制体积大小，并根据模型信息做进一步的性能优化。

该方案有以下优点：

随着框架的迭代将不会使得推理引擎的体积增大
很多的算子融合可以在编译时根据模型信息生成对应的 code
模型编译时可以获得整个计算图的信息，这样可以进一步进行极致的性能优化
可以吸收社区在代码生成方面的经验用于为 MegCC 生成 code

不同于传统推理框架，MegCC 是一个真真实实的深度学习模型编译器，具备极其轻量的 Runtime 二进制体积，高性能，方便移植，极低内存使用以及快启动等核心特点。用户可在 MLIR 上进行计算图优化，内存规划，最后通过预先写好的 code 模版进行代码生成。目前，MegCC 已支持 Arm64 ，Armv7 ，x86 ，risc-v 以及单片机平台。

GitHub 开源地址：https://github.com/MegEngine/MegCCgithub.com/MegEngine/MegCC