hadoop—查找文件中数据类型的最快方法

8qgya5xd  于 2021-05-29  发布在  Hadoop
关注(0)|答案(1)|浏览(328)

我的问题很简单,但事实上它可能是一个真正的头像。确定文件中包含哪种数据最有效、最快的方法是什么。
例如,如果您有一个原始文件,其列数为。。。
你能给我一些提示吗?:)
ps:我对小文件使用python,对大文件使用hortonworks。
谢谢!

zzzyeukh

zzzyeukh1#

事实上,我想要这样的快速回报: truckid STRING, driverid STRING, event STRING, latitude DOUBLE, longitude DOUBLE, city STRING, state STRING, velocity INT, event_ind INT, idling_ind INT

相关问题