问题描述
如何在 Lucene 3.6.2 中使用 Porter Stemmber 类?这是我所拥有的:
How to use the Porter Stemmber class in Lucene 3.6.2? Here is what I have:
import org.apache.lucene.analysis.PorterStemmer;
...
PorterStemmer stemmer = new PorterStemmer();
term = stemmer.stem(term);
有人告诉我:PorterStemmer 在 org.apache.lucene.analysis 中不公开;无法从外部包访问.
I am being told: PorterStemmer is not public in org.apache.lucene.analysis; cannot be accessed from outside package.
我还广泛阅读了有关使用 Snowball 的信息,但不鼓励这样做.在 Java 中使用 Lucene 的正确方法是什么?
I also read extensively about using Snowball, but it isn't encouraged. What is the right way to stem using Lucene in Java??
推荐答案
1) 如果您想使用 PorterStemmer 作为 Lucene 令牌分析过程的一部分,请使用PorterStemFilter
1) If you want to use PorterStemmer as part of Lucene token analysis process, use PorterStemFilter
示例代码
class MyAnalyzer extends Analyzer {
public final TokenStream tokenStream(String fieldName, Reader reader) {
return new PorterStemFilter(new LowerCaseTokenizer(reader));
}
}
<小时>
2) 如果您只想将 PorterStemmer 用于任何其他应用程序,这里是作者自己的源代码:PorterStemmer in Java
这篇关于Lucene Porter Stemmer 未公开的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持跟版网!