如何使用pig处理图像文件

knsnq2tg  于 2021-06-03  发布在  Hadoop
关注(0)|答案(1)|浏览(343)

有100个不同颜色的图像文件。我想根据颜色得到唯一的图像

vsdwdz23

vsdwdz231#

没有用于处理图像数据的内置hadoop/pig api。
要使用pig/mapreduce处理图像数据,请使用以下步骤:
将所有图像转换为序列文件

Key             Value
Image_file_id   Image Content

将此文件加载到hdfs中。
使用任何第三方库进行检测,如“haar cascades”作为pig中的udf,或者调用mapreduce程序中的java库。

相关问题