https://github.com/pandodao/tokenizer-go
最近在用 Go 做基于 OpenAI API 的应用,需要在请求前对 token 做检查,当请求太大时可以自动的缩减 (Chat completions) 或者分批次请求 (Embeddings),github 没找到可以在 Go 里用的包,所以打算自己写一个。
从头实现的难度太大,取巧了一下,embed 了现成的 npm 包,然后通过 JavaScript 函数调用来获取结果,这样在 Go 里就跟原生包一样直接用了。得益于使用的 goja 库是纯 Go 实现的 JavaScript engine ,所以也不需要 CGO 那些,从 Benchmark 上看执行效率也不错。有类似需求的话可以直接使用。