我所说的“分隔符”是指标记分隔符:通常是分隔标记本身的非字母数字文本的位。
这可能吗?i、 e.在标记之间以及标记之间存储文本部分。
我想这样做的原因是,我想执行一些序列分析,基于除了大小写变体之外完全相同的文本部分,以及除了标记之间的分隔符之外完全相同的文本部分。
为此,我还希望能够“压平重音”,并在此基础上分析其他相同的序列:我发现es有一种方法可以做到这一点,“ascii折叠标记过滤器”。
与其自己编写代码来实现这一点,不如使用es索引中包含的信息——特别是在规定了术语向量的情况下,es做了大量需要的工作。但如果我真的找不到分析分隔符差异的方法,这个想法就不那么有希望了。
暂无答案!
目前还没有任何答案,快来回答吧!