Lucene 实战教程第十章使用 PerFieldAnalyzerWrapper 为不同字段指定不同分词器

公告：“业余草”微信公众号 AI 中转站提供免费体验，点击链接 https://unity2.ai/register?ref=3XTnndN2 进行访问，支持 Claude、ChatGPT、Gemini 等最新模型！关注业余草微信公众号，添加作者微信：xttblog2！
本博客日IP超过2000，PV 3000 左右，急需赞助商。
极客时间所有课程通过我的二维码购买后返现24元微信红包，请加博主新的微信号：xttblog2，之前的微信号好友位已满，备注：返现
受密码保护的文章请关注“业余草”公众号，回复关键字“0”获得密码
所有面试题(java、前端、数据库、springboot等)一网打尽，请关注文末小程序
视频教程免费领

【腾讯云】1核2G5M轻量应用服务器50元首年，高性价比，助您轻松上云

从教程的第一篇到现在，大家可能会发现一个问题。那就是所有的 Document 文档或者 Field 字段都使用的是同一个分词器。那么有没有办法让不同的 Field 使用不同的分词器呢？

答案就是 PerFieldAnalyzerWrapper。这也是为什么我把它单独抽出来作为一章的原因。

如果一个文档需要多个分词器，可以这样做：

Analyzer analyzer = new StandardAnalyzer();
IndexWriter writer = new IndexWriter(direcotry, analyzer, true);
Document doc = new Document();
// 正常情况下
writer.addDocument(doc);
// 如果要新添加一个分词器，可以这样做，analyzer
writer.addDocument(doc, new KeywordAnalyzer());

如果是多个 Field，也可以分别为每一个 Field 指定分词器。做法如下：

PerFieldAnalyzerWrapper aWrapper = new PerFieldAnalyzerWrapper(new StandardAnalyzer()); 
aWrapper.addAnalyzer("cnname", new KeywordAnalyzer()); 
aWrapper.addAnalyzer("enname", new StandardAnalyzer());

需要注意的是：在索引阶段，对应字段使用了什么分词器，同样的在检索阶段，也必须这样处理，否则无法检索到结果。

业余草公众号

最后，欢迎关注我的个人微信公众号：业余草（yyucao）！可加作者微信号：xttblog2。备注：“1”，添加博主微信拉你进微信群。备注错误不会同意好友申请。再次感谢您的关注！后续有精彩内容会第一时间发给您！原创文章投稿请发送至532009913@qq.com邮箱。商务合作也可添加作者微信进行联系！

本文原文出处：业余草： » Lucene 实战教程第十章使用 PerFieldAnalyzerWrapper 为不同字段指定不同分词器

一	二	三	四	五	六	日
« 6月
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

相关文章推荐