python-3.x 阅读 parquet 文件的Pandas

gxwragnw  于 2022-11-26  发布在  Python
关注(0)|答案(1)|浏览(156)

我正在给Pandas读 parquet 文件

data=pd.read_parquet('MyFiles.parquet', engine='pyarrow')

但我收到以下错误

ArrowInvalid: Casting from timestamp[us] to timestamp[ns] would result in out of bounds timestamp: 253402214400000000

如果我把发动机改成fastparquet

data=pd.read_parquet('MyFiles.parquet', engine='fastparquet')

还有这个错误

AttributeError: 'numpy.ndarray' object has no attribute 'tz'
y4ekin9u

y4ekin9u1#

时间戳在不同时区的列出现问题。您可能需要先下载parquet文件,然后在转换为PandasDataFrame之前修改它。一些相关问题:Parquet File datetime value mismatch

相关问题