我需要对大字符串(存储为文件)执行字符串搜索。如果我使用hadoop的传统inputsplit方法,可能会出现这样的情况:搜索字符串,即使它在文件中,也会被分成两个不同的部分。为了避免这种情况,我需要搜索重叠的数据分割。有什么办法做这个任务吗?
目前还没有任何答案,快来回答吧!
暂无答案!
目前还没有任何答案,快来回答吧!