现在我正在实现apache配置单元,并且我现在配置单元也像通常的hadoop mapreduce一样运行mapreduce算法。所以,我想知道,关于mapreduce,mapper和reducer的解释。那查询怎么做mapreduce呢?谢谢大家。。。。。
4si2a6ki1#
类似于oracle或mysql在这些数据库中运行sql查询时对sql所做的操作。有一个解析器解析查询,然后构建出数据库引擎能够理解的特定于oracle/mysql的指令。类似地,hive有一个解析器和优化器,它将sql查询转换为mr。例如,从表\u name中选择count(*);将转换为mapper(读取文件和计数)-->reducer(对所有计数求和并返回)。
1条答案
按热度按时间4si2a6ki1#
类似于oracle或mysql在这些数据库中运行sql查询时对sql所做的操作。有一个解析器解析查询,然后构建出数据库引擎能够理解的特定于oracle/mysql的指令。类似地,hive有一个解析器和优化器,它将sql查询转换为mr。
例如,从表\u name中选择count(*);将转换为mapper(读取文件和计数)-->reducer(对所有计数求和并返回)。