elasticsearch：存储分隔符和标记？

20jt8wwn 于 2021-07-13 发布在 ElasticSearch

关注(0)|答案(0)|浏览(235)

我所说的“分隔符”是指标记分隔符：通常是分隔标记本身的非字母数字文本的位。
这可能吗？i、 e.在标记之间以及标记之间存储文本部分。
我想这样做的原因是，我想执行一些序列分析，基于除了大小写变体之外完全相同的文本部分，以及除了标记之间的分隔符之外完全相同的文本部分。
为此，我还希望能够“压平重音”，并在此基础上分析其他相同的序列：我发现es有一种方法可以做到这一点，“ascii折叠标记过滤器”。
与其自己编写代码来实现这一点，不如使用es索引中包含的信息——特别是在规定了术语向量的情况下，es做了大量需要的工作。但如果我真的找不到分析分隔符差异的方法，这个想法就不那么有希望了。

elasticsearch tokenize sequence

来源：https://stackoverflow.com/questions/67257027/elasticsearch-store-delimiters-as-well-as-tokens

暂无答案！

目前还没有任何答案，快来回答吧！

我来回答

elasticsearch：存储分隔符和标记？

暂无答案！

相关问题

热门标签

最新问答