Lucene 实战教程第十章使用 PerFieldAnalyzerWrapper 为不同字段指定不同分词器

JAVA herman 413浏览
公告:“业余草”微信公众号提供免费CSDN下载服务(只下Java资源),关注业余草微信公众号,添加作者微信:xttblog,发送下载链接帮助你免费下载!
本博客日IP超过1800,PV 2600 左右,急需赞助商。
极客时间所有课程通过我的二维码购买后返现24元微信红包,请加博主新的微信号:xttblog,之前的微信号好友位已满,备注:返现
所有面试题(java、前端、数据库、springboot等)一网打尽,请关注文末小程序
视频教程免费领

从教程的第一篇到现在,大家可能会发现一个问题。那就是所有的 Document 文档或者 Field 字段都使用的是同一个分词器。那么有没有办法让不同的 Field 使用不同的分词器呢?

答案就是 PerFieldAnalyzerWrapper。这也是为什么我把它单独抽出来作为一章的原因。

如果一个文档需要多个分词器,可以这样做:

Analyzer analyzer = new StandardAnalyzer();
IndexWriter writer = new IndexWriter(direcotry, analyzer, true);
Document doc = new Document();
// 正常情况下
writer.addDocument(doc);
// 如果要新添加一个分词器,可以这样做,analyzer
writer.addDocument(doc, new KeywordAnalyzer());

如果是多个 Field,也可以分别为每一个 Field 指定分词器。做法如下:

PerFieldAnalyzerWrapper aWrapper = new PerFieldAnalyzerWrapper(new StandardAnalyzer()); 
aWrapper.addAnalyzer("cnname", new KeywordAnalyzer()); 
aWrapper.addAnalyzer("enname", new StandardAnalyzer()); 

需要注意的是:在索引阶段,对应字段使用了什么分词器,同样的在检索阶段,也必须这样处理,否则无法检索到结果。

业余草公众号

最后,欢迎关注我的个人微信公众号:业余草(yyucao)!可加QQ1群:135430763(2000人群已满),QQ2群:454796847(已满),QQ3群:187424846(已满)。QQ群进群密码:xttblog,想加微信群的朋友,之前的微信号好友已满,请加博主新的微信号:xttblog,备注:“xttblog”,添加博主微信拉你进群。备注错误不会同意好友申请。再次感谢您的关注!后续有精彩内容会第一时间发给您!原创文章投稿请发送至532009913@qq.com邮箱。商务合作可添加助理微信进行沟通!

本文原文出处:业余草: » Lucene 实战教程第十章使用 PerFieldAnalyzerWrapper 为不同字段指定不同分词器