我使用的Spark与气流,但不能通过的论点。我已经尝试了多种方法,请建议在哪里正确的方式做到这一点。
dag.py文件:
base_operator = SparkKubernetesOperator(
application_file="spark-pi.yaml",
task_id='segment_tag_refresh_process',
namespace="spark-jobs",
api_group="sparkoperator.k8s.io",
api_version="v1beta2",
parms= {"ID": '1'},
dag=dag
)
字符串
spark-pi.yaml
apiVersion: sparkoperator.k8s.io/v1beta2
kind: SparkApplication
metadata:
name: spark-create-file
spec:
type: Scala
mode: cluster
image: imagefilename
imagePullSecrets:
- sparkairlow
imagePullPolicy: IfNotPresent
mainClass: org.apache.spark.examples.
mainApplicationFile: local:///data/processing.py
arguments: {{ parms.ID}}
sparkVersion: 3.5.0
sparkConf:
spark.eventLog.enabled: "true"
spark.eventLog.dir: /data/logs
....
other configurations
....
型
在阅读processing.py上的参数时,我使用系统参数阅读:
import sys
print("**********",sys.argv)
型
但找不到论据。
如果有人认为我失踪了,请问我会更新。
1条答案
按热度按时间2g32fytz1#
我使用以下方法解决了这个问题:
dag.py
字符串
spark-pi.yaml
型
阅读processing.py上的论点
型
现在对我有用了