avro模式生成

a5g8bdjr 于 2021-06-02 发布在 Hadoop

关注(0)|答案(1)|浏览(408)

我有一个场景，在hdfs中有一些avro文件集，我需要为hdfs中的avro数据文件生成avro模式文件(https://github.com/databricks/spark-avro/blob/master/src/main/scala/com/databricks/spark/avro/schemaconverters.scala).
除了将avro数据文件带到本地并执行hdfs put之外，还有其他方法吗。
欢迎任何建议。谢谢！

hadoop avro apache-spark spark-avro

来源：https://stackoverflow.com/questions/40047074/avro-schema-generation-in-hdfs

1条答案

按热度按时间

cetgtptt1#

每个avro文件都包含在它的avro模式中。您可以使用avrotools.jar（从maven下载）提取这个模式。您只能下载一个部分（假设所有其他文件都是用相同的模式编写的）并使用avro工具（java-jar~/workspace/avro-tools-1.7.7.jar getschema .avro）来提取它

赞(0）回复(0）举报 2021-06-02

我来回答

avro模式生成

1条答案

相关问题

热门标签

最新问答