当我通过Office365 Admin电子邮件浏览器运行安全报告以获取有关电子邮件及其各自攻击类型的详细信息时,我下载了.csv文件,并手动使用Microsoft Excel筛选出确切的电子邮件主题行,并保存到自己的.csv文件。这花了很长时间来创建单独的CSV文件,因为有相当多的各种电子邮件具有相同或不同的主题标题作为值。
1.已从Office 365管理门户下载.csv文件,日期范围为过去7天(日期范围)。
1.使用下面的R命令导入到R中:Office_365_Report_CSV = "C:/Users/absnd/Documents/2022-11-18office365latestquarantine.csv"
1.已从库中导入表。require(data.table)
1.创建了一个新变量,将数据转换为数据框。quarantine_data = fread(paste0(Office_365_Report_CSV),sep = ",", header = TRUE, check. Names = FALSE)
1.提取数据框中需要筛选的列。Quarantine_Columns = quarantine_data[,c("Email date (UTC)","Recipients","Subject","Sender","Sender IP","Sender domain","Delivery action","Latest delivery location","Original delivery location","Internet message ID","Network message ID","Mail language","Original recipients","Additional actions","Threats","File threats","File hash","Detection technologies","Alert ID","Final system override","Tenant system override(s)","User system override(s)","Directionality","URLs","Sender tags","Recipient tags","Exchange transport rule","Connector","Context" )]
1.需要完成的步骤(我不确定下一步):- 我想让R写入具有相同“主题”值行的单个.csv文件,这些行必须包含步骤5中的所有上述列数据。
子步骤-例如,如果行数据包含列(名为“Threats”)=“Phish”内的值,则生成名为“YYYY-MM-DD Phishing〈number increment +1〉. csv”的文件。
子步骤-例2如果行数据包含列(名为“威胁”)内的值=网络钓鱼、垃圾邮件”,则生成名为“YYYY-MM-DD网络钓鱼和垃圾邮件〈数字增量+1〉. csv”的CSV文件。
第6步等步骤将筛选出行的相同“主题”列值,并将具有相同主题电子邮件值的行保存到单个文件中,该文件将基于上述第6步中的子步骤中的if条件命名。
1条答案
按热度按时间l2osamch1#
首先,您希望在R中实现这一点- RStudio是一个IDE,它使R的使用更容易。
如果将数据框保存在列表中,然后设置一个文件名向量,并将其给予每个文件,则可以使用
purrr::walk2()
来迭代保存过程。