报告所使用的数据集来源于阿里云天池大赛-日常学习赛-【AI入门系列】金融守护者:金融风险预测学习赛
数据下载链接:https://tianchi.aliyun.com/competition/entrance/531830/information
本文首先针对金融风控数据大量类别型特征和缺失值的特点进行了数据处理与特征工程,并利用AUC指标对GBDT、随机森林和深度神经网络三种算法进行比较,发现GBDT在预测精度和效率上都有显著优势,并且具有良好的可解释性。利用GBDT(Lightgbm)模型,银行等金融企业可以更高效地进行贷款决策,降低时间和人力成本,有效降低违约风险,助力金融产业高质量发展。