最近 Linggle 貌似挂掉了,只要搜索就白屏,不知道有什么好的代替品可以推荐吗。
一直觉得在线服务不靠谱,所以有没有什么现成的办法可以把数据离线下来?(大小没问题) 或者有没有提供下载语料库并提供离线数据检索的网站?
1
Perry 2018-05-09 07:13:03 +08:00 via iPhone 1
https://writefullapp.com/
https://ludwig.guru/ |
2
ynyounuo 2018-05-09 07:43:25 +08:00 1
没挂啊 - -
离线其实也蛮方便的 可以从 Full-text corpus data ( https://www.corpusdata.org/) 或者 open parallel corpus ( http://opus.nlpl.eu/) 下载相应的语料库然后用 grep/ag/rg 之类的工具用正则搜索想要的内容然后结合 wl 等输出结果。 这样因为支持正则的缘故也更灵活,可信度调控可以根类,open parallel corpus 可以选择只包含书籍的 corpus。不过无论如何也都是比不过 Google 的数据量大啦,一般使用没啥问题吧。 另外 IRC 聊天的 log 也可作为很好的 corpus,尤其是比如说 freenode 的 ##English 这类频道。 |