我是新的Spark,试图了解,如何是Spark优势时,使用它通过Spark cassandra 连接器上的 cassandra 集群。
1.如何通过spark-Cassandra连接器(spark SQL查询,是否仍涉及协调器节点?)将(例如savetocassandra)写入Cassandra?
1.如何通过spark-Cassandra连接器(spark SQL查询)读取Cassandra,它还涉及协调器节点吗?
1.在星系团的高距离读取扫描中,是什么让Spark克服了 cassandra 的负载?
1.如何通过spark-Cassandra连接器在Cassandra集群上执行高范围扫描cql读取查询?
1.在Cassandra集群上通过spark-Cassandra连接器使用IN子句是否具有优势?
1条答案
按热度按时间xriantvc1#
如果你想了解spark-cassandra-connector的内部结构,我也推荐其他的Russell讲座。Cassandra和Spark优化数据局部性- Russell Spitzer(DataStax)https://www.youtube.com/watch?v=ikCzILOpYvA