如何在R中为多个csv文件中的每一列找到有效或null行?

eblbsuwk  于 2023-07-31  发布在  其他
关注(0)|答案(1)|浏览(109)

我有各种.csv文件。每个文件都有多个列。我想做一个质量检查,对于一个特定的列,有多少行有有效值,有多少行是null..就像如果一行有一些值,返回Valid或该值,否则返回null或FALSE。我想对R中的所有列,所有文件都这样做。最后,我还需要一个日志文件。
我的示例数据:

D_T  Temp (°C)  Press (Pa)  ...
2021-03-01 00:00:00+00  28  1018  ...
2021-03-02 00:00:00+00  27  1017  ...
2021-03-03 00:00:00+00  28  1019  ...
..
..

字符串

jdgnovmf

jdgnovmf1#

首次安装包

install.packages("readr")

字符串
然后
粘贴代码并运行它

check_column <- function(df, column) {
  valid_values <- !is.na(df[[column]])
  num_valid <- sum(valid_values)
  num_null <- nrow(df) - num_valid
  return(c(num_valid, num_null))
}

    Read the CSV file
    df <- read_csv("data.csv")
    

    for (column in names(df)) {
      results <- check_column(df, column)
      print(paste(column, ": ", results[1], " valid, ", results[2], " null"))
    }

相关问题