• 请不要在回答技术问题时复制粘贴 AI 生成的内容
xe2vxe2v
V2EX  ›  程序员

最近采集数据碰到的问题:对方网站用了自定义字体防采集 求 Java 破解方法

  •  
  •   xe2vxe2v · Aug 22, 2018 · 2937 views
    This topic created in 2839 days ago, the information mentioned may be changed or developed.

    目前网上好像只给出了 python 的解决方式 -->https://www.jianshu.com/p/79c4272c0969 其中用到了 fonttools 库提取字体,不知道有没有大佬有 java 解决方案

    5 replies    2018-08-23 02:50:54 +08:00
    huxiaohaiyang
        1
    huxiaohaiyang  
       Aug 22, 2018
    只是数字吧,不用实时解析字体,看下字符集,写好对应规则转换就行了
    JCZ2MkKb5S8ZX9pq
        2
    JCZ2MkKb5S8ZX9pq  
       Aug 22, 2018
    有点意思。不过只要转换一下就好了,啥语言都不难吧。
    另外,人家这么防着了,尊重一下 robots 协议啊……
    xe2vxe2v
        3
    xe2vxe2v  
    OP
       Aug 22, 2018
    @huxiaohaiyang 想做一个实时解析的 这样就不用改代码了
    xe2vxe2v
        4
    xe2vxe2v  
    OP
       Aug 22, 2018
    @JCZ2MkKb5S8ZX9pq java 好像没有解析如. woff 字体文件的类吧?
    JCZ2MkKb5S8ZX9pq
        5
    JCZ2MkKb5S8ZX9pq  
       Aug 23, 2018
    @xe2vxe2v 不用解析吧……你手动下载字体文件,看看改了啥映射,自己写个映射就好了。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2468 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 42ms · UTC 16:01 · PVG 00:01 · LAX 09:01 · JFK 12:01
    ♥ Do have faith in what you're doing.