如何使用url将数据加载到配置单元中

polhcujo  于 2021-06-24  发布在  Hive
关注(0)|答案(1)|浏览(438)

我已经在配置单元中创建了一个表,我需要将csv数据加载到配置单元表中,但是数据在github中(我已经下载并测试过,它工作正常)我需要直接从url加载数据是否可以从url将数据加载到配置单元中
像这样的事情可以奏效

LOAD DATA  INPATH 'https://github.com/xx/stock-prices.csv' INTO TABLE 
stocks;
svdrlsy4

svdrlsy41#

可以使用下面的命令将数据从平面文件加载到配置单元中。
从apache hive wiki:

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)] [INPUTFORMAT 'inputformat' SERDE 'serde'] (3.0 or later)

如果指定了关键字local,hive将在本地文件系统中查找文件路径并从那里加载。如果没有指定关键字local,hive会在hdfs文件系统中查找文件路径并在那里加载数据。
您可以为hdfs文件和本地文件指定完整uri。
例子:

file:///user/data/project/datafolder (Local Path)

hdfs://namenode:10001/user/data/project/datafolder (HDFS path)

这意味着无法从https直接将数据加载到配置单元中。所以你必须先下载数据并加载到hive中。
这不是解决办法,而是正确答案。

相关问题