我们创建了一个mapreduce作业,将数据注入bigquery。在我们的工作中没有太多的过滤功能,所以我们想让它只Map工作,使它更快,更有效。
但是,bigquery接受的java类“com.google.gson.jsonobject”没有实现hadoopMap器接口所需的可写接口。jsonobject也是final的,我们不能扩展它。。。
对我们如何解决这个问题有什么建议吗?
谢谢,
我们创建了一个mapreduce作业,将数据注入bigquery。在我们的工作中没有太多的过滤功能,所以我们想让它只Map工作,使它更快,更有效。
但是,bigquery接受的java类“com.google.gson.jsonobject”没有实现hadoopMap器接口所需的可写接口。jsonobject也是final的,我们不能扩展它。。。
对我们如何解决这个问题有什么建议吗?
谢谢,
2条答案
按热度按时间dl5txlt91#
附加到william的响应:我想自己测试一下,我创建了一个安装了bigquery连接器的新集群,然后运行以下map-only作业:
我有以下依赖关系:
lqfhib0f2#
您应该能够为hadoop使用bigquery连接器(请参阅https://cloud.google.com/hadoop/bigquery-connector)它提供了hadoop outputformat类的实现。