我正在使用PyCharm 2022.3.3(专业版),我有以下警告:
MRE:
import pandas as pd; path_to_csv = "mycsv.csv"; df_db = pd.read_csv(path_to_csv, usecols=[0])
文档(https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html)说:
usecols类列表或可调用,可选返回列的子集。如果是类列表,所有元素必须是位置元素(即,到文档列中的整数索引)或与用户在名称中提供的或从文档标题行推断的列名相对应的字符串(s).如果给出名称,则单据表头行例如,一个有效的列表式usecols参数应该是[0,1,2]或['foo',' bar ','baz']。元素顺序被忽略,所以usecols=[0,1,2]。1]与[1,0]相同。若要从保留元素顺序的数据示例化DataFrame,请对pd.read按["foo“,”bar“]顺序排列的列使用www.example.com _csv(data,usecols=[”foo","bar"])“foo "," bar ",或对按[”bar","foo"]顺序排列的列使用pd.read_csv(data,usecols=[“foo”,“bar”])["bar",“foo”。
如果可调用,则可调用函数将根据列名进行计算,返回可调用函数计算为True的名称。有效可调用参数的示例是lambda x:x.upper()in ['AAA',' BBB ','DDD']。使用此参数可大大加快解析时间并降低内存使用量。
我不知道发生了什么事。
我用的是pandas 1.5.3和python 3.11.1。
1条答案
按热度按时间ccgok5k51#
这是一个
pandas-stubs
的问题。一个问题已经产生,一个PR刚刚被合并。