我想在应用其他过滤器(例如停止字删除)之后,将多个令牌连接成一个令牌。
我能找到的最接近的东西是指纹过滤器。不幸的是,令牌被排序和重复数据消除,我看不到一种方法来禁用它。
我还发现了一个过时的插件,可以做我想要的。但是好吧,。。它过时了,不能与es7.x一起使用(2.x似乎是最后支持的版本)。
令牌的数量不是固定的,因此最小值为最大值的shingle筛选器也不起作用。
我还有没有别的办法错过呢?
例子:
In: "Hauptstraße ABC ABC"
Filter (this works so far): haupt, str, abc, abc
fingerprint*: abc_haupt_str
What I really want: hautp_str_abc_abc
- 中间解决方案(不是我想要的)
暂无答案!
目前还没有任何答案,快来回答吧!