我正在给Pandas读 parquet 文件
data=pd.read_parquet('MyFiles.parquet', engine='pyarrow')
但我收到以下错误
ArrowInvalid: Casting from timestamp[us] to timestamp[ns] would result in out of bounds timestamp: 253402214400000000
如果我把发动机改成fastparquet
data=pd.read_parquet('MyFiles.parquet', engine='fastparquet')
还有这个错误
AttributeError: 'numpy.ndarray' object has no attribute 'tz'
1条答案
按热度按时间y4ekin9u1#
时间戳在不同时区的列出现问题。您可能需要先下载parquet文件,然后在转换为PandasDataFrame之前修改它。一些相关问题:Parquet File datetime value mismatch