我正在努力学习prestodb,我有一个mysql数据库。这个数据库只是一个相对较小的数据库,我用它来了解presto如何处理jdbc连接。
我已经使用presto连接到一个hive元存储,并且我了解了它如何处理orc文件,presto工作人员如何获取数据并根据需要运行查询。
这张照片对我来说非常清晰:
很明显,并行化将如何与这个模型一起工作。
但是在mysql连接中,如何用关系数据库并行数据呢?prest是否将表加载到worker,然后运行查询?
或者直接在mysql中运行查询并创建结果的接口?
1条答案
按热度按时间wtlkbnrh1#
presto创建单个jdbc连接,并以单线程方式从mysql中提取数据。
将来,如果对数据进行分区(为每个分区创建单独的jdbc连接),presto将能够并行地从mysql中提取数据。