我正在用python处理从SAS服务器获取的一些数据。我目前正在使用SASPY to_df()函数把它从SAS带到本地Pandas。我想知道是否有可能过滤/查询正在传输的数据,这样我就可以避免带来不必要的,并加快我的下载。我在saspy文档中找不到任何东西,它只提供了使用“**kwargs”的可能性,但我不知道如何使用它。谢谢。
brvekthn1#
您需要使用WHERE= dataset选项定义sasdata对象以限制提取的观测。https://sassoftware.github.io/saspy/api.html#saspy.sasdata.SASdata然后,当您使用to_df()方法时,只会传输选定的数据。您还可以使用KEEP=或DROP=数据集选项来限制传输的变量。请记住,为了引用WHERE=选项中的任何变量,必须保留这些变量。“**kwargs”看起来是关于改变你连接到SAS服务器的方式,所以这对你想要什么并不重要。
1条答案
按热度按时间brvekthn1#
您需要使用WHERE= dataset选项定义sasdata对象以限制提取的观测。
https://sassoftware.github.io/saspy/api.html#saspy.sasdata.SASdata
然后,当您使用to_df()方法时,只会传输选定的数据。
您还可以使用KEEP=或DROP=数据集选项来限制传输的变量。请记住,为了引用WHERE=选项中的任何变量,必须保留这些变量。
“**kwargs”看起来是关于改变你连接到SAS服务器的方式,所以这对你想要什么并不重要。