我有一个数据库,里面有人们用来在网上搜索东西的不同字母/单词。因为我们跟踪他们键入的内容,所以我们拥有他们键入的所有字母/单词,以便使用我们网站上的自动完成功能获得短语。我们有如下数据:
Time Phrase Clicked
6/17/20 13:03 Micr
6/17/20 13:03 Micorosoft
6/17/20 13:03 Micor
6/17/20 13:03 Microsft
6/17/20 13:03 Microsoft TRUE
6/17/20 13:33 Brex
6/17/20 13:43 los
6/17/20 14:01 ama
6/17/20 14:01 Amazon TRUE
6/17/20 14:03
6/17/20 14:03 u
6/17/20 14:03 ujo
6/17/20 14:03 upjn
6/17/20 14:03 upjoh
6/17/20 14:03 upjohn TRUE
正如你在上面看到的,有人想搜索微软,所以他开始输入。他确实漏拼了很多次,但还是找到了自动完成提示的匹配项。他点击的那一个“点击”类别被标记为“真”。我想生成一个列表,列出用户正在键入的所有字母/单词(甚至是拼写错误的字母/单词)以到达词尾。对于微软,它捕获了上面显示的所有短语。亚马逊和厄普约翰也是如此。因为“brex”和“los”这样的短语不会导致点击,所以我们可以丢弃它们。如何在python中实现这一点?
最后,数据库如下所示:
Completed Phrase Letter/Words
Microsoft Micr
Micorosoft
Micor
Microsft
Microsoft
Amazon ama
Amazon
Upjohn u
ujo
upjn
upjoh
Upjohn
暂无答案!
目前还没有任何答案,快来回答吧!