splunk和其他数据库解决方案

iecba09b  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(482)

我需要编写一个存储大量结构化和非结构化数据的系统。我的查询将查找文本以及二进制信息。
我在寻找一个符合这些要求的解决方案。我遇到了splunk,它看起来非常友好,提供了一个很好的api。然而,它似乎非常面向日志,似乎只支持文本搜索(没有二进制)。我的数据不是日志,只是我需要搜索的大量原始文本/二进制数据。。。
所以我的问题是:
splunk能很好地解决我的问题吗?有办法进行二进制搜索吗?
有没有更好的解决办法?可能是hadoop(我读过一点,再说一次,我不确定这是不是我想要的)?
谢谢!

qybjjes1

qybjjes11#

splunk将支持各种非结构化、半结构化和结构化的机器数据,日志只是一个这样的机器数据示例。其他的则是syslog提要、jmx/snmp度量、os命令的输出、调用细节记录、clickstream度量、专有管理/监视界面的输出、社交媒体提要等。。名单是庞大的。
就二进制数据而言,您需要首先将其展开并将其解码为文本,许多人实际上是这样做的:捕获网络的二进制数据,例如专有协议,并对其进行解码。
另外,需要注意的是,splunk不使用数据库,它在磁盘上收集数据并将其索引为一种简单的压缩文件格式,然后它的体系结构允许它进行扩展,以便大规模地收集和搜索所有这些数据。

相关问题