我从csv文件创建spark dataframe,并尝试将其插入到包含integer和varchar列的rdbms表中。因为我的Dataframe都是字符串类型,所以它在“append”模式下失败。如果我使用覆盖模式,rdbms表将用所有varchar列重新创建。如何通过处理sparkDataframe中的dataype将数据以append模式插入rdbms表?
我从csv文件创建spark dataframe,并尝试将其插入到包含integer和varchar列的rdbms表中。因为我的Dataframe都是字符串类型,所以它在“append”模式下失败。如果我使用覆盖模式,rdbms表将用所有varchar列重新创建。如何通过处理sparkDataframe中的dataype将数据以append模式插入rdbms表?
1条答案
按热度按时间ct3nt3jp1#
在读取csv时,您可以推断模式或以编程方式指定模式。
一旦这个Dataframe具有所需的模式,就可以附加到现有表中。
请检查:https://docs.databricks.com/data/data-sources/read-csv.html