我目前正试图帮助我们的市场研究团队准备/清理一些非常混乱的调查数据。我得到了一个csv文件(计划导入db表),里面有大约2000人对30个问题的回答。
这项调查提出了一些问题,比如“你最喜欢的电视节目是什么?”或者“你经常玩哪3款手机游戏?”。受访者能够随心所欲地回答问题,所以你可以想象,数据非常混乱。
所以在手机游戏的问题中,答案往往是这样的:
1. Candy Crush and Clash of Clans
2. Candy Crush Saga, Clash, Bejeweled Blitz
3. BEJEWELED
4. Pac-man
5. PACMAN
etc etc
我应该采取什么方法通过sql和/或excel清理和统一这些数据?显然不是想得到一切,而是尽可能多。
暂无答案!
目前还没有任何答案,快来回答吧!