推销一下 :)
https://github.com/jack139/go-infer
深度学习模型在部署时通常以云方式部署,通过 API 对外体提供推理服务。这个框架提供了部署 API 时的基本架构组件,实现了几个目标:
其他功能:
1
Zhao70 2022-07-27 17:59:33 +08:00 2
楼主做的这个东西和我工作领域有一些重合度,star 一下。
不过有几个问题需要注意: 1. tensorflow 版本有些低,是 1.15.4 ,貌似不支持 avx, avx2, fma 指令集,建议升级下,大概可以提升 20%的 CPU 打分性能。 2. bert 算法使用了 github.com/buckhx/gobert 这个算法库,这个库在生产环境 Wordpiece Tokenize 存在字符串分片不会被 gc 的问题,再就是对于特殊 query 导致死循环,服务 OOM |
2
Juszoe 2022-07-27 18:32:45 +08:00
看起来不错,有兼容 pytorch 或者 onnx 的打算吗
|