首页
问答库
知识库
教程库
标签
AI工具箱
登录
注册
投稿
大数据 linux
+ 关注
文章:
25
|
问答:
0
|
关注:
0
暂无介绍
文章
|
问答
636
浏览
大数据:脚本实现WordCount,结果以压缩格式输出到HDFS
大数据 linux
大数据
hdfs
hadoop
HDFS
字数 (4.7k)
浏览 (636)
点赞 (0)
评价 (0)
2022-07-05 
397
浏览
大数据:对数据进行简单排序、分桶排序——以WordCount为例
大数据 linux
大数据
其他
字数 (3.8k)
浏览 (397)
点赞 (0)
评价 (0)
2022-07-05 
517
浏览
大数据:以Linux脚本实现 Map Reduce 的运用 —— 以wordCount为例
大数据 linux
big data
linux
hadoop
Linux
字数 (1.6k)
浏览 (517)
点赞 (0)
评价 (0)
2022-06-08 
599
浏览
大数据:MapReduce 文件分发与打包 —— 以wordCount为例
大数据 linux
mapreduce
big data
hadoop
MapReduce
字数 (6.0k)
浏览 (599)
点赞 (0)
评价 (0)
2022-06-08 
466
浏览
Kafka:IDEA Receiver方式消费kafka数据
大数据 linux
kafka
big data
大数据
spark
Kafka
字数 (1.9k)
浏览 (466)
点赞 (0)
评价 (0)
2021-12-11 
655
浏览
Spark:Streaming 实践 Dstream 转换算子、窗口、输出文件
大数据 linux
spark
大数据
flume
streaming
Spark
字数 (11.6k)
浏览 (655)
点赞 (0)
评价 (0)
2021-12-07 
601
浏览
Flume:kafka+flume 对接数据
大数据 linux
大数据
flume
kafka
python
Flume
字数 (2.2k)
浏览 (601)
点赞 (0)
评价 (0)
2021-12-02 
614
浏览
Flume:搭建配置以及 source读取在netcat、http,sink 落实在本地、HDFS
大数据 linux
hadoop
flume
大数据
Flume
字数 (6.0k)
浏览 (614)
点赞 (0)
评价 (0)
2021-11-29 
706
浏览
大数据:数据的日志采集与用途
大数据 linux
大数据
数据仓库
其他
字数 (4.3k)
浏览 (706)
点赞 (0)
评价 (0)
2021-11-25 
926
浏览
Spark:运行架构与原理、作业运行模型、RDD、调优 理论介绍
大数据 linux
spark
大数据
Spark
字数 (5.3k)
浏览 (926)
点赞 (0)
评价 (0)
2021-11-22 
468
浏览
在Linux环境实现wordcount:mapper,reducer的代码创建,脚本实现map,reduce
大数据 linux
linux
hadoop
hdfs
Linux
字数 (3.7k)
浏览 (468)
点赞 (0)
评价 (0)
2021-11-21 
584
浏览
MapReduce 计算框架 —— 执行流程详解
大数据 linux
mapreduce
big data
大数据
MapReduce
字数 (4.3k)
浏览 (584)
点赞 (0)
评价 (0)
2021-11-21 
532
浏览
Python:Linux hadoop 脚本实现 reduce合并数据
大数据 linux
hadoop
linux
python
Python
字数 (2.5k)
浏览 (532)
点赞 (0)
评价 (0)
2021-11-21 
413
浏览
Linux:reduce实现 合并列表数据
大数据 linux
linux
python
hadoop
Linux
字数 (0.8k)
浏览 (413)
点赞 (0)
评价 (0)
2021-11-21 
703
浏览
Hadoop:Hive 数据管理、内外表、安装模式操作
大数据 linux
Hive
hadoop
数据仓库
Hadoop
字数 (2.7k)
浏览 (703)
点赞 (0)
评价 (0)
2021-11-21 
774
浏览
Hive:多种方式建表,需求操作
大数据 linux
Hive
hadoop
数据仓库
Hive
字数 (3.4k)
浏览 (774)
点赞 (0)
评价 (0)
2021-11-21 
802
浏览
Hive:分区原因、创建分区、静态分区 、动态分区
大数据 linux
Hive
hadoop
数据仓库
Hive
字数 (2.6k)
浏览 (802)
点赞 (0)
评价 (0)
2021-11-21 
621
浏览
Hive:分桶的简介、原理、应用、创建
大数据 linux
Hive
big data
hadoop
Hive
字数 (2.6k)
浏览 (621)
点赞 (0)
评价 (0)
2021-11-21 
707
浏览
Hive:优化Reduce,查询过程;判断数据倾斜,MAPJOIN
大数据 linux
Hive
big data
hadoop
Hive
字数 (5.0k)
浏览 (707)
点赞 (0)
评价 (0)
2021-11-21 
557
浏览
Scala:实现 wordCount 需懂得的基础知识,真不简单
大数据 linux
scala
Hive
sql
hadoop
Scala
字数 (5.1k)
浏览 (557)
点赞 (0)
评价 (0)
2021-11-21 
803
浏览
Spark:SQL操作 cache、filter、selectExpr、agg、join、udf
大数据 linux
scala
hadoop
spark
scala
Spark
字数 (4.1k)
浏览 (803)
点赞 (0)
评价 (0)
2021-11-21 
862
浏览
Hive:数据进行替换切分后的结果保存为新表,新表进行分词
大数据 linux
Hive
python
大数据
Hive
字数 (2.4k)
浏览 (862)
点赞 (0)
评价 (0)
2021-11-21 
594
浏览
Spark:spark-shell 处理需求
大数据 linux
Hive
spark
大数据
Shell
字数 (2.8k)
浏览 (594)
点赞 (0)
评价 (0)
2021-11-21 
1312
浏览
Hive:用SQL对数据进行操作,导入数据、清洗脏数据、统计数据订单、优化结果输出等等
大数据 linux
Hive
sql
hadoop
Hive
字数 (9.0k)
浏览 (1312)
点赞 (0)
评价 (0)
2021-11-21 
首页
上一页
1
下一页
末页
热门标签
更多
Java
query
python
Node
开发语言
request
Util
数据库
Table
后端
算法
Logger
Message
Element
Parser
最新文章
更多
高级程序员和新手小白程序员区别你是那个等级看解决bug速度
浏览(958)
发布于
4个月前
还在用双层for循环吗?太慢了
浏览(909)
发布于
3个月前
我用EasyExcel优化了公司的导出(附踩坑记录)
浏览(954)
发布于
4个月前
记录因Sharding Jdbc批量操作引发的一次fullGC
浏览(797)
发布于
4个月前
进大厂必须要会的单元测试
浏览(790)
发布于
3个月前