我对R(+编程,数据分析,...)完全陌生,并没有真正掌握它。
我有一个5列的数据集。一列是“公司名称”,一列是“部门”,每个公司与26个部门中的一个相匹配。对于我的回归,我只想区分“环境敏感”和“非环境敏感部门”。变量是一个字符。因此,我想将26个不同的扇区分配给“env_sensitive_sectors”或“nonenv_sensitive_sectors”。
我已经通过论坛和YouTube,但我似乎找不到特定于我的问题的代码。
到目前为止,我已经创建了一个向量,但我甚至不知道这是否有必要。我是否应该创建一个新列,以便我可以使用这个新列进行回归?
环境敏感和非环境敏感行业
env_sensitive_sectors <- c(“航空公司”,“能源”,“地面和海洋运输”,“医疗保健”,“工业”,“制造业”,“采矿”,“材料”,“技术和电信”)
nonenv_sensitive_sectors <- c(“Agriculture”,“Consumergoods”,“ConsumerGoods”,“ConsumerServices”,“CosmeticIndustry”,“Education”,“Fashion”,“FinancialServices”,“InternationalOrganization”,“LawFirms”,“LuxuryGoods”,“Media”,“Municipality”,“Non-GovernmentalOrganization”,“ProfessionalServicesFirms”,“PublicSector”,“Publicsector”)
(我知道得太晚了,例如。“Public Sector”同时以大写S和小写s的形式出现,因此故意以两种形式出现)
我觉得有一个很简单的解决办法,但我找不到。有人能帮忙吗?
1条答案
按热度按时间3phpmpom1#
像这样的东西就可以了
使用
dplyr
包