具有有效贷款数据的hadoop用例

j0pj023g  于 2021-06-02  发布在  Hadoop
关注(0)|答案(2)|浏览(246)

我在txt文件中有一些贷款收购的重要数据集注:我可以获得过去3年第一季度至第四季度的数据。
另外,请在图像文件中找到采集文件每列的字段描述。
1) 你能帮我生成一些有效的逻辑业务用例吗?我想用hdfs和mapreducejava编程实现它们。
因为大多数样本都使用大小写-与字数统计和天气数据分析有关。
要获取数据文件-只需登录即可

数据-文件

链接

vecaoik1

vecaoik11#

-loanperformancedata.fanniemae.com/lppub-docs/acquisition-sample-file.txt
100009503314 |通讯员|富国银行,n.a.| 3.75 | 320000 | 360 | 12/2011 | 02/2012 | 67 | 67 | 1 | 32 | 798 |编号|采购| pud | 1 |委托人| ca | 949 | frm
100010175842 |零售|其他| 3.875 | 255000 | 360 | 2012年2月| 2012年4月| 73 | 73 | 1 | 49 | 778 |无现金流出再融资| sf 1 |本金| oh | 432 | frm
100013227768 |经纪人| flagstar capital markets corporation | 3.875 | 415000 | 360 | 12/2011 | 03/2012 | 46 | 46 | 2 | 21 | 780 |否|无现金流出再融资| pud | 1 |本金| va | 223; frm
100016880542 |零售|富国银行,n.a.| 4.25 | 417000 | 360 | 2011年11月| 012012 | 90 | 90 | 2 | 40 | 794 |否|购买| sf 1 |本金| ca | 956 | 25 | frm

2) 数据的列描述

链接-loanperformancedata.fanniemae.com/lppub-docs/lppub\u file\u layout.pdf
贷款识别码渠道卖家名称原始利率原始未付本金余额(upb)原始贷款期限发放日期首次付款日期原始贷款价值比(ltv)原始综合贷款价值比借款人债务收入比信用评分首次购房者指标贷款用途物业类型套数占用状态财产状态zip(3位数字)抵押贷款保险百分比产品类型
链接------->loanperformancedata.fanniemae.com/lppub-docs/lppub\u glossary.pdf
请帮助我-建立一些有效的业务用例和java程序来实现相同的。
-hadoop的大部分数据是-weather count和word count示例:(

slmsl1lt

slmsl1lt2#

您可以进行简单的筛选和聚合,以确定具有最大贷款数量和最低信用评分的状态。这可能有助于洞察在批准违约率高得多的贷款时存在的问题。

相关问题