我已经在配置单元中创建了一个表,我需要将csv数据加载到配置单元表中,但是数据在github中(我已经下载并测试过,它工作正常)我需要直接从url加载数据是否可以从url将数据加载到配置单元中像这样的事情可以奏效
LOAD DATA INPATH 'https://github.com/xx/stock-prices.csv' INTO TABLE stocks;
svdrlsy41#
可以使用下面的命令将数据从平面文件加载到配置单元中。从apache hive wiki:
LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)] LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)] [INPUTFORMAT 'inputformat' SERDE 'serde'] (3.0 or later)
如果指定了关键字local,hive将在本地文件系统中查找文件路径并从那里加载。如果没有指定关键字local,hive会在hdfs文件系统中查找文件路径并在那里加载数据。您可以为hdfs文件和本地文件指定完整uri。例子:
file:///user/data/project/datafolder (Local Path) hdfs://namenode:10001/user/data/project/datafolder (HDFS path)
这意味着无法从https直接将数据加载到配置单元中。所以你必须先下载数据并加载到hive中。这不是解决办法,而是正确答案。
1条答案
按热度按时间svdrlsy41#
可以使用下面的命令将数据从平面文件加载到配置单元中。
从apache hive wiki:
如果指定了关键字local,hive将在本地文件系统中查找文件路径并从那里加载。如果没有指定关键字local,hive会在hdfs文件系统中查找文件路径并在那里加载数据。
您可以为hdfs文件和本地文件指定完整uri。
例子:
这意味着无法从https直接将数据加载到配置单元中。所以你必须先下载数据并加载到hive中。
这不是解决办法,而是正确答案。