使用hadoop反规范化

ax6ht2ek 于 2021-06-04 发布在 Hadoop

关注(0)|答案(1)|浏览(498)

我目前正在做一个使用hadoop的项目。我们正处于项目的开始阶段。
首先，我有大约50个关系数据库表。我们提取了它们，然后在hdfs上导出。现在，我们要将引用数据反规范化为“大表”（只有3-4个文件）。我想我会用MapReduce来做这项工作。我知道用小table怎么办，但用大table。。。。
例如，我有一个包含数百万条条目的表“ticket”，还有一个包含150亿条条目的表“lign”的join。我必须去规范化它们。
我的问题是，有什么方法可以应用或最佳实践吗？
提前谢谢你，安吉利克

hadoop mapreduce relational-database denormalization

来源：https://stackoverflow.com/questions/22507517/de-normalization-with-hadoop