我已经从Tweepy流推并将其存储为文本文件as such。现在我想将其转换为pandas Dataframe ,但我不知道如何。我已经尝试在Stack Overflow和pandas文档中寻找类似的帖子,但我仍然不确定如何开始解析所有这些数据。
回答:通过将json文件转换为列表,然后将其转换为 Dataframe ,解决了这个问题。感谢所有帮助我们的人。
tweets = []
for line in open('tweets.txt', 'r'):
tweets.append(json.loads(line))
df = pd.DataFrame(tweets)
2条答案
按热度按时间djmepvbi1#
你不需要将你的文本文件转换成json来读取它作为pandas dataframe,只需要做:
它应该可以工作。这假设你的格式是:
{"name": "first json"}
而不是:
{"name": "first json"}{"name": "second json"}
然而,如果你有第二种格式,那么你可以只是任何这些方法(有很多):
遍历文件**-〉跟踪开括号-〉创建json对象-〉将它们附加到列表-〉**将列表输入pandas。
或者使用split并添加删除的括号:
这与第二个解决方案相同,但缩写为:
然后你可以调用任何你想选择的:
bfrts1fy2#
如果你的json文件(yourfile.txt)中有多条tweet,并且你想把它们都读入你的 Dataframe :