我用apache pig在二进制文件上运行一个作业。作业结果是有效的json,例如:
{
"filename": "hello_world.exe",
"strings":
[
"!This program cannot be run in DOS mode.",
"LRich",
".text"
]
}
有没有办法使用pig“store”命令将这个结果/json输出直接保存到mongodb?
更新(pig脚本):
register 'my.jar';
%default INPUT 'myfile.bla'
%default OUTPUT 'generic_text.out'
data = load '$INPUT' using myloader('myScript.py');
STORE data INTO '$OUTPUT';
我的作业的json输出(见上文)存储在变量数据中。目前,我的pig脚本正在将输出写入文件generic_text.out。我希望将结果存储到现有的mongodb集合中,而不是保存到文件中。
2条答案
按热度按时间6mzjoqzu1#
直到我告诉你的是,你想把这个json作为一个新文档直接存储到mongodb集合中。我可以说,你可以迭代json键并通过循环插入字段,或者你也可以通过另一种方式将json字符串化并在某个键处插入这个json
data
.ee7vknir2#
mongoimport是将json数据导入mongodb的实用工具。
请参考以下包含mongo导入文档的url
https://docs.mongodb.org/v3.0/reference/program/mongoimport/