我正在使用flink从azure数据湖读取数据。但是flink无法找到azure数据湖文件系统。我已经实现了spark来读取azure数据湖文件系统文件。
所以我尝试的是触发flink的spark来读取azure数据湖中的数据,然后执行一些逻辑并将列表返回给flink。所以Flink可以利用这些数据?
有可能触发Flink的Spark任务吗?或者如何配置flink来理解azure数据湖文件系统。有人能给我指点一下吗?
我正在使用flink从azure数据湖读取数据。但是flink无法找到azure数据湖文件系统。我已经实现了spark来读取azure数据湖文件系统文件。
所以我尝试的是触发flink的spark来读取azure数据湖中的数据,然后执行一些逻辑并将列表返回给flink。所以Flink可以利用这些数据?
有可能触发Flink的Spark任务吗?或者如何配置flink来理解azure数据湖文件系统。有人能给我指点一下吗?
1条答案
按热度按时间w8biq8rn1#
让这个场景工作的正确方法是直接从adl读取数据。通过触发另一种机制如Spark来实现这一点很复杂。
这个问题包含这样做的信息:如何配置flink来理解azuredatalake文件系统?