alex321
V2EX  ›  Java

问一个如何在 Hadoop 中正确引入 IK 资源包的基础问题

  •  
  •   alex321 ·
    alexroyce315 · Sep 2, 2016 · 2185 views
    This topic created in 3544 days ago, the information mentioned may be changed or developed.
    情况是这样的,由于用 PHP 做那 2000w 文字的词频提取耗时太长了,就 Google 了一下,发现 Hadoop 可以做词频分析,就在虚拟机上部署好了 Hadoop ,基本的 WordCount 跑通,然后就想着更改一下,使用 IK 来分词,下载了 IKAnalyzer2012_u6 资源包,把 IKAnalyzer2012_u6.jar 先后放在 /usr/local/hadoop-2.7.3/example 目录下、/usr/local/hadoop-2.7.3/bin 目录下、/usr/local/hadoop-2.7.3/lib 目录下,/usr/lib/jvm/java-8-openjdk-amd64/lib 目录下,结果,当我执行 ./bin/hadoop com.sun.tools.javac.Main ./example/ChineseWordCount.java 的时候,怎么来都给我下面这样的错误:
    ./example/ChineseWordCount.java:7: error: package org.wltea.analyzer.core does not exist
    import org.wltea.analyzer.core.IKSegmenter;
    ^
    ./example/ChineseWordCount.java:8: error: package org.wltea.analyzer.core does not exist
    import org.wltea.analyzer.core.Lexeme;
    ^
    请 v2er 们指教一下。。
    1 replies    2016-09-02 18:29:52 +08:00
    apoclast
        1
    apoclast  
       Sep 2, 2016
    在虚拟机上跑 hadoop...还不如直接本机跑
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   885 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 19:31 · PVG 03:31 · LAX 12:31 · JFK 15:31
    ♥ Do have faith in what you're doing.