获取map reduce作业的结果作为流

a0x5cqrl  于 2021-06-04  发布在  Hadoop
关注(0)|答案(2)|浏览(423)

我在用java写一个map reduce作业,我想知道是否可以将作业的输出作为流(可以是输出流)而不是物理输出文件。我的目标是将流用于另一个应用程序。

tcbh2hod

tcbh2hod1#

您可以编写一个自定义输出格式,并使用该格式写入任何您想要的流。不一定是文件。请参阅本教程,了解如何编写自定义输出格式。
或者您可以使用hadoop流api。看看这里。

bq3bfh9z

bq3bfh9z2#

我不认为你能用apachehadoop做到这一点。它被设计成在一个分布式系统中工作,afaik提供了一种发射信号的方法 output stream 会违背目的,因为那时系统将如何决定要发射的流,即哪个还原剂!你可以写一个平面文件/db/amazon-s3等,但也许你不会得到一个流。

相关问题