赞
踩
问题一:请绘制附件中“有无发生电信银行卡诈骗”比例的扇形图,并绘制 发生电信银行卡诈骗的案例中,“线上”和“线下”发生电信诈骗数量的柱状图。
统计电信银行卡诈骗比例:首先,您需要统计出整个数据集中有多少比例的交易被标记为诈骗(Fraud=1)和没有被标记为诈骗的(Fraud=0)。
统计线上与线下诈骗数量:接着,仅在标记为诈骗的交易中,分别统计线上(Online=1)和线下(Online=0)发生的诈骗数量。
绘制扇形图:使用电信银行卡诈骗比例数据,绘制一个扇形图,以直观地展示诈骗与非诈骗交易的比例。您可以使用Excel、Python的Matplotlib库中的pie()
函数等工具来完成这个绘图任务。
绘制柱状图:使用线上与线下诈骗数量的数据,绘制一个柱状图,对比线上和线下诈骗的数量。可以使用Excel、Python的Matplotlib库中的bar()
函数等工具来制作柱状图。
以您提供的数据为例(虽然只有一条被标记为诈骗,不能代表整体情况),进行以下假设性统计:
问题二:请通过数据分析发生电信诈骗的案例中,“是否使用银行卡在设备 上进行转账交易”和“是否使用银行卡的 pin 号码进行转账交易”的指标,判断 哪种情况更容易发生电信诈骗?使用银行卡的pin 号码是否可以减少被骗概率?
通过对比‘Card’(表示是否使用银行卡在设备上进行转账交易,1表示使用,0表示未使用)和‘Pin’(表示是否使用银行卡的PIN号码进行转账交易,1表示使用,0表示未使用)的值来分析哪种情况更容易发生电信诈骗,并且看使用PIN号码是否可以显著减少被骗的概率。
问题三:请分析所有发生电信诈骗的案例中,哪些指标与是否发生电信诈骗 有较强的相关性?“银行卡转账交易是否发生在同一银行”和“是否是线上的银 行卡转账交易”是否与电信银行卡诈骗有显著的关联性?
问题四:请分析附件中所有的指标数据,选取合适的指标,建立“电信银行 卡诈骗的预测模型”,并选取合适的训练集和测试集,计算预测模型的准确率。 为了降低电信诈骗的概率,保护人们的财产安全,请基于你们团队数据分析的结 果,分别给公安部门、银行和市民们提出你们的建议。
首先,你需要进行数据清洗和预处理。这可能包括处理缺失值、异常值和数据标准化或归一化。
基于问题三的分析,你可以从数据中选择与电信诈骗强相关的指标。例如,如果发现Online
, Repeat
, Card
, 和 Pin
与电信诈骗具有较高的相关性,你可以将它们作为模型的特征。
使用如逻辑回归、随机森林或梯度提升树等算法,以选定的特征训练模型。你需要将数据集分为训练集和测试集。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。