我在将pd更新到mysql db时遇到问题
for stock_code in cleaned:
url = 'https://www.hkex.com.hk/chi/sorc/options/statistics_hv_iv_c.aspx?action=csv&type=3&ucode={0}'.format(stock_code)
df = pd.read_csv(url,index_col='交易日', header=0, skiprows=2)
df.index.names = ['Trade Date']
df.index = pd.to_datetime(df.index, dayfirst=True)
df.insert(loc=0, column ='Stock Code', value=stock_code)
df.columns = ['Stock Code', 'Implied IV (%)','HV10 (%)','HV30 (%)','HV60 (%)','HV90 (%)']
df.to_sql(con=database_connection, name='table', if_exists='append')
database_connection.close()
url将提供最近3个月的数据:即2018-08-25到2018-11-25,今天之后url将提供2018-08-26到2018-11-26的数据,我想要的是将所有数据保存在db中,不重复。
我将'trade date'和'stock code'设置为主键,但它会产生错误:(mysql.connector.errors.integrityerror)1062(23000):键'primary'[sql]的重复条目'2018-11-23-00001'
如何跳过重复条目而只更新新行?谢谢!
暂无答案!
目前还没有任何答案,快来回答吧!