RT,工作需要,针对同一个业务,会选取不同数据(比如不同时间段)、 不同算法、不同参数进行模型训练,有时候模型太多 就难以管理了(目前就靠命名区分。。)
另外还有一个问题,就是比如 lightgbm 这样的包,保存下来的模型文件,是不带超参数的( sklearn 的是带的),每次都要手动单独保存。
因此有了一个需求,有没有一个开源工具(最好能兼容 诸多算法包),能够每次完成训练,自动(或者半自动)记录 这次训练选取的数据集、模型参数、模型文件。
求助。
1
stcasshern OP 回复关注本主题的同学。。MLflow ( databricks 开源 )可以满足该需求
|