使用pyspark dataframes和jdbc插入和更新mysql表

aor9mmx1 于 2021-05-27 发布在 Spark

关注(0)|答案(1)|浏览(808)

我正在尝试使用pysparksqlDataframe和jdbc连接在mysql上插入和更新一些数据。
我使用savemode.append成功地插入了新数据。有没有办法从pysparksql更新现有数据并在mysql表中插入新数据？
我要插入的代码是： myDataFrame.write.mode(SaveMode.Append).jdbc(JDBCurl,mySqlTable,connectionProperties) 如果我改为savemode.overwrite，它会删除完整的表并创建一个新表，我会在mysql中寻找类似“on duplicate key update”的内容
在此方面的任何帮助都将不胜感激。

mysql jdbc apache-spark pyspark upsert

来源：https://stackoverflow.com/questions/62695035/insert-update-mysql-table-using-pyspark-dataframes-and-jdbc

1条答案

按热度按时间

nhhxz33t1#

在中创建视图 Mysql 作为 create view <viewName> as select ...<tableName> 在mysql中创建触发器，以便在插入后使用-

CREATE TRIGGER trigger_name
    AFTER INSERT
    ON <viewName> FOR EACH ROW
BEGIN
    -- statements
    -- INSERT ... ON DUPLICATE KEY UPDATE Statement
END$$

参考-https://www.mysqltutorial.org/mysql-triggers/mysql-after-insert-trigger/
写入要查看的数据 <viewName> 从Spark

赞(0）回复(0）举报 2021-05-27

我来回答

使用pyspark dataframes和jdbc插入和更新mysql表

1条答案

相关问题

热门标签

最新问答