pig使用变量来存储数据。当我将hdfs中的数据加载到pig中的变量时。数据临时存储在哪里?当我们将数据加载到变量中时,在后台到底发生了什么?好心的帮助
fjnneemd1#
pig懒散地计算大多数表达式。在大多数情况下,它会检查语法错误等,
a = load 'hdfs://I/Dont/Exist'
除非你使用 STORE 或者 DUMP 或者类似于那些导致 a 类似地,如果文件存在,并且您将其加载到关系中并对其执行转换,则该文件将被后台处理到 /tmp 然后执行转换。如果查看在上运行命令时显示的消息 grunt ,您会注意到文件路径以 file:///tmp/_201706171047235 . 这些是存储中间数据的文件。
STORE
DUMP
a
/tmp
grunt
file:///tmp/_201706171047235
1条答案
按热度按时间fjnneemd1#
pig懒散地计算大多数表达式。在大多数情况下,它会检查语法错误等,
除非你使用
STORE
或者DUMP
或者类似于那些导致a
类似地,如果文件存在,并且您将其加载到关系中并对其执行转换,则该文件将被后台处理到/tmp
然后执行转换。如果查看在上运行命令时显示的消息grunt
,您会注意到文件路径以file:///tmp/_201706171047235
. 这些是存储中间数据的文件。