我想将数千个 Dataframe 连接到一个VAEX Dataframe 中https://vaex.readthedocs.io/en/latest/api.html?highlight=concat#vaex.concat
我愿意:
df_vaex = vaex.DataFrame()
for i,file in enumerate(files):
df = pd.read_pickle(file)
df_vx = vaex.from_pandas(df=df, copy_index=False)
df_vaex.concat(df_vx)
if i%100 == 0:
print(i)
这不起作用。
如何在vaex中读取和连接 Dataframe ?
我得到的错误是,vaex没有方法concat:AttributeError:“DataFrame”对象没有属性“concat”
小时
第二次尝试遵循第一条评论:
for i,file in enumerate(files):
df = pd.read_pickle(file)
df_vaex_total = vaex.from_pandas(df=df, copy_index=False)
if i == 0:
pass
else:
print(type(df_vaex_total)) # its equal to <class 'vaex.dataframe.DataFrameLocal'>
print(type(df_vx)) # its equal to <class 'vaex.dataframe.DataFrameLocal'>
df_vaex_total = pd.concat([df_vaex_total, df_vx])
if i%10 == 0:
print(i)
错误:TypeError:无法连接类型为“<class”的vaex.dataframe对象。DataFrameLocal“>”;只有Series和DataFrame对象有效
1条答案
按热度按时间fgw7neuy1#
如果您想使用vaex连接 Dataframe ,您需要按照以下方式进行:
df_final = vaex.concat(list_of_dataframes)
所以你的代码看起来像这样: