我在做一步一步的指导http://aws.amazon.com/articles/5249664154115844
步骤:创建输入表
hive>
CREATE EXTERNAL TABLE english_1grams (
gram string,
year int,
occurrences bigint,
pages bigint,
books bigint
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'
STORED AS SEQUENCEFILE
LOCATION 's3://datasets.elasticmapreduce/ngrams/books/20090715/eng-all/1gram/';
我的系统内置:ubuntu+(hadoop+hive)不是aws(ec2),所以我改了 LOCATION -> LOCATION 'home/hduser/googlebook'
文件夹googlebook obtaine:所有文件,我有下载在http://storage.googleapis.com/books/ngrams/books/datasetsv2.html 版本2
所以我有一个问题是当我询问
hive>SELECT * from ngrams
结果是0->数据库没有数据?我该怎么办??
1条答案
按热度按时间oyxsuwqo1#
我不清楚你的问题,但你创建的表是
english_1grams
但你的hql是select * from ngrams
.这是我的步骤,我确信我能看到数据。
我从googlebook网站下载数据并解压缩到我的主文件夹。
输入从本地到hadoop的配置单元拷贝数据
dfs -copyFromLocal ${env:HOME}/googlebooks-eng-all-1gram-20120701-2 /user/hive/warehose/googlebook
我创建表格