我需要从一些大型mysql表中获取数据,以便能够显示在 Jmeter 板/web门户上。我的重点主要是在给定数据集大小的情况下提高sql性能。
另外,考虑到ignite使用ram作为主要数据源,ApacheIgnite的可扩展性是否比ApacheDrill差?
请让我知道的情况下,更多的细节是需要的。
我浏览了以下链接:http://drcos.boudnik.org/2015/04/apache-ignite-vs-apache-spark.htmlhttpshttp://mpouttuclarke.wordpress.com/2016/01/04/why-i-trued-apache-spark-and-moved-on/
在igfs下面使用可选的hdfs层是否会将系统的性能降低到sparksql的水平?https://ignite.apache.org/features/igfs.html
2条答案
按热度按时间klh5stk11#
drill只是一个主要用于nosql数据库的sql查询引擎。由于内存处理的原因,它的性能与hive和许多nosql数据库相比是好的。
在drill-here中检查查询执行是如何工作的。
可扩展性
apachedrill具有高度的可伸缩性,无需担心。
你不能在理论上比较两个重叠的工具。我建议您在这两个工具上做一个poc,获取一些mysql样本数据。性能在很大程度上取决于您的用例。
drill最适合查询复杂的json文件(因为它的列式布局)和解决多语言用例(跨多个数据存储执行连接)。
eaf3rand2#
另外,考虑到ignite使用ram作为主要数据源,ApacheIgnite的可扩展性是否比ApacheDrill差?
内存中有数据实际上可以更好地扩展。我对drill了解不多,也无法进行比较,但ignite非常注重可伸缩性和可伸缩性。
在igfs下面使用可选的hdfs层是否会将系统的性能降低到sparksql的水平?https://ignite.apache.org/features/igfs.html
如果将hdfs用作辅助文件系统,则仅当请求的数据还没有存储在内存中时,才可以访问它。因此,正确使用它不会减慢你。
请注意,ignite提供了非常丰富的sql功能[1]。您只需在内存中加载数据,并通过快速索引搜索运行符合ansi-99的查询即可运行。例如,sparksql根本不支持任何索引,这使得它在许多情况下速度慢得多(至少据我所知)。
[1] https://apacheignite.readme.io/docs/sql-queries