机房360首页
当前位置:首页 » 大数据 » 基于大数据风控方向的大数据计算平台需求整理

基于大数据风控方向的大数据计算平台需求整理

来源:csdn 作者: 更新时间:2019/9/27 10:55:32

摘要:而信托行业在进军消费金融的路上面临的挑战会更多一些——信托行业近年来和房地产和基建等行业关系更加紧密一些,相比银行等行业,直接服务用户的经验和能力,基础数据和基础设施等都比较薄弱甚至欠缺。

  为响应国家深化金融体制改革的要求,各大金融机构都在探索服务下沉,包括信托行业在内,很多金融机构都在尝试消费金融各种场景。而信托行业在进军消费金融的路上面临的挑战会更多一些——信托行业近年来和房地产和基建等行业关系更加紧密一些,相比银行等行业,直接服务用户的经验和能力,基础数据和基础设施等都比较薄弱甚至欠缺。

  本人在支持消费金融业务的过程中,就风控需求做了一些整体的设计和实施。在过程中,就大数据相关的需求做了如下的规划。

大数据需求分解思维导图

  需求分解图

  数据存储

  除了支持HDFS存储,还需要打通OSS——考虑到日志采集方案。

  参考 使用Hive进行OSS数据处理的一个最佳实践 ,需要如下的feature:

  ETL

  从数据源的角度来说,需要支持:


  从工具的角度,需要支持:

  计算引擎

  为了支持特征工程的生产任务,需要支持批量计算与流式计算的常用计算引擎/模式,并需要支持UDF,MR等扩展能力。

  除此之外,为了支持后续采购联合建模服务,需要支持较多数据探索和模型训练等方面的需求,故也需要综合考虑python、R等集成,以及mahout、keras等;

  调度

  生产级的支持,对周期性调度的需求是与生俱来的。同时,由于oozie等常用开源调度引擎都是基于一张DAG对应一个调度作业的模式,而每次更改(比如加入新的数据处理节点)都需要重启作业,同时过大的DAG维护难度也更高,所以需要考虑通过某种机制打破这种局限,实现“图间依赖”调度。

  安全

  安全性生产级平台的重要考虑,而金融行业更是如此。

  开发-生产管理模式

  界面

  监控

  责任编辑:张华

机房360微信公众号订阅
扫一扫,订阅更多数据中心资讯

本文地址:http://www.jifang360.com/news/2019927/n5264122441.html 网友评论: 阅读次数:
版权声明:凡本站原创文章,未经授权,禁止转载,否则追究法律责任。
转载声明:凡注明来源的文章其内容和图片均为网上转载,非商业用途,如有侵权请告知,会删除。
相关评论
正在加载评论列表...
评论表单加载中...
  • 我要分享
推荐图片