将数据导入hve(使用googlebooks n-grams数据查找趋势主题)

w51jfk4q  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(294)

我在做一步一步的指导http://aws.amazon.com/articles/5249664154115844
步骤:创建输入表

hive>
CREATE EXTERNAL TABLE english_1grams (
 gram string,
 year int,
 occurrences bigint,
 pages bigint,
 books bigint
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
STORED AS SEQUENCEFILE
LOCATION 's3://datasets.elasticmapreduce/ngrams/books/20090715/eng-all/1gram/';

我的系统内置:ubuntu+(hadoop+hive)不是aws(ec2),所以我改了 LOCATION -> LOCATION 'home/hduser/googlebook' 文件夹googlebook obtaine:所有文件,我有下载在http://storage.googleapis.com/books/ngrams/books/datasetsv2.html 版本2
所以我有一个问题是当我询问

hive>SELECT * from ngrams

结果是0->数据库没有数据?我该怎么办??

oyxsuwqo

oyxsuwqo1#

我不清楚你的问题,但你创建的表是 english_1grams 但你的hql是 select * from ngrams .
这是我的步骤,我确信我能看到数据。
我从googlebook网站下载数据并解压缩到我的主文件夹。
输入从本地到hadoop的配置单元拷贝数据 dfs -copyFromLocal ${env:HOME}/googlebooks-eng-all-1gram-20120701-2 /user/hive/warehose/googlebook 我创建表格

create external table english_gram(
    gram string,
    year int,
    page int,
    book int)
    row format delimited
    fields terminated by '\t'
    stored as textfile
    location 'hdfs://ubuntu:9005/user/hive/warehouse/googlebook';
``` `select * from english_gram;` 您将看到数据。

相关问题