一个关于汉语教学里面拆字的问题,需要不同笔画标出每笔的顺序,也要让每个笔画使用不同颜色区分。总字数可能有点多,希望有批量的方法。
请问有什么现成的程序可以这样标注嘛?(试了 word 和 ppt 基本上只能根据部首或者连通图来区分,ps 的话工作量太大了也不准确)
以及如果没有的话,是否可以从哪些数据库或者什么网站找到每个字的笔画顺序和每笔的起末位置、笔画形状呢?
上面的问题已经自己找过,没有能找到答案。特此来求助,谢谢~
1
renmu123 2022-04-19 15:12:17 +08:00 via Android 1
你要先确定字体,市面上应该有类似的产品,js 的话有 chchar 可以处理
|
2
mekingname 2022-04-19 15:17:13 +08:00
这个简单,可以通过神经网络训练以后自动生成。
|
3
mekingname 2022-04-19 15:21:08 +08:00
这个技术叫做 instance segmentation ,使用 maskrcnn 网络来做。你只需要人工标注一两百个汉字就可以了,然后它可以自动泛化到所有汉字,甚至包括日语和部分韩语。
|
4
WaterWestBolus OP @renmu123 字体的话,正常书写的字体比如楷体、宋体都可以。您说的 chchar 我没有搜到,可否给个链接呢?
@mekingname 自己分割的话可能还是有点蛋疼啊...工作量有点大,想找一个基于书写原理的而不是基于神经网络的方法,我先试一下看看。谢谢 |
5
WaterWestBolus OP @renmu123 谢谢,根据您的提示找到了,但不是 chchar 而是 cnchar 。源码在此 https://github.com/theajack/cnchar
如有朋友有更好的解决方案可以继续回复~感谢大家。 |