"I opened the box to see my phone , only to find a happy birthday card with 20 dollars in it"
希望能提取到 "happy birthday card", "happy birthday" 这种短语
1
zix 2018-02-04 15:41:05 +08:00 2
几个思路:
1. 利用句法分析,找句中的紧密连接的成分,比如说名词短语、动宾短语等,试试 Stanford NLP 的工具,这里有个 demo: http://nlp.stanford.edu:8080/corenlp/process 2. 利用词性标注,以及人工设计的语法规则,来抽取,比如说:(动词:VN) + [形容词:ADJ + 名词:NOUN],就把后面的 [形容词:ADJ + 名词:NOUN] 的部分抽取出来。如果要抽取的短语比较简单或者不想做句法分析(相对较耗时),可以试试这种办法 3. 利用信息熵、互信息的手段,挖掘共现比较多的词作为短语,这个适用于你有比较多的数据而且内容所在的领域比较集中的情况。 |