从哪里获取大数据管道的示例数据和查询?

svdrlsy4  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(397)

我正在寻找一些真实世界的数据和查询,能够用来测试色调。这些数据需要使用不同的技术(pig、hive等)来创建管道。我可以找到单独的pig或hive脚本,但没有涉及不同框架的真实管道示例。
我在大数据的数据方面还没有完全跟上,所以我很难创建任何真实世界的用例。此外,如Spark的例子是琐碎的字计数等。
在哪里可以为管道挖掘一些数据,以及管道的相关步骤?这样我就可以根据需要将注意力集中在色调ui上。

yv5phkfx

yv5phkfx1#

你可以看看hue的博客,这里有一些用spark、sql或流处理自行车数据的实际例子。

相关问题