如何利用移动数据进行诈骗识别?

2016-08-11 14:46 SAS中文论坛 古月 3条评论
关注海滨博客微信公号:21氪网(微信搜索公号“21氪网”)

最近风头正劲的大数据风控,可以在对用户数据的关联分析中发现蛛丝马迹,从而阻止欺诈的进一步发生。但是,对于很多有大数据风控需求的公司来说,最大的问 题是没有足够的数据。当前,市面上虽然有提供外部数据校验的产品,但如果笔笔业务都查,势必增加很多成本。能够有什么低成本的办法,可以先过滤掉那些潜在 的欺诈用户呢?就让大数据专家来讲一讲,如何用手机端得到IP数据的相关数据进行欺诈判断的干货吧。

海滨博客,移动数据.jpg

一、IP数据 最直接的就是看IP

最直接的就是通过IP来看。IP所揭示的风险几何?可以从以下几个角度来判断:

1 代理IP判定

在互联网上每天有许多公开的代理IP,代理IP的目的是为了隐藏自己的真实IP,所以使用代理的,基本上可以判断为有欺诈嫌疑。可以通过每天的自动爬虫,爬取互联网上的代理IP作为黑名单。

2 IDCIP

一个toc的贷款业务,跑来注册的IP是云服务器的IP,这正常吗?显然不正常。事实上很多就是被黑的服务器,或干脆就是自己租的服务器来恶意借款。这里就要去做一些收集,各大云服务商、各大IDC服务器段。可以维护下来作为黑名单。

3 技术判定

反向探测对端端口开放情况:代理常用端口是80和8080,如果对端IP开启了这些端口,显然是不正常的,一个家用IP地址是不大会开放这些端口的。

HTTP头的X-Forwarded-For:这个字段只有在通过了HTTP 代理时才会添加,如果带有XFF,那就是代理了。

源端口:大于10000的源端口有两种情况,不是代理就是大型机构,所以会有误伤,建议判断权重在50%。

Keep-alive:带有Proxy-Connection: Keep-Alive的报文,毫无疑问是代理。

二、手机号码认证 建立自己的高风险库

用户在注册或者提交资料时候的手机号码,也是一个可以验证的维度。这里也可以通过一些方法收集所谓“黑名单”,可以有以下几种途径:

1 收码平台手机

欺诈分子通过在收码平台上开项目,可以使用大批量的不同号码来注册。通过爬虫定期爬取,可以得到这些信息。

2 小号手机号码

目前有一些小号软件,可以虚拟一个号码出来,这些号码像正常电话一样,可以打出去,接听,收发短信。在网上搜索:小号,即可找到大量类似平台。把这些号码爬取下来作为黑名单库。

3 撞库法

利用注册用户的手机号码,去各类P2P平台上注册,如果提示号码已被注册,则说明该用户对资金有较强需求。

4 定向爬虫

例如在一些分类信息网站上爬取中介的手机号码,作为高风险库。

三、设备指纹 世界上每台设备都是独一无二的

世界上没有完全相同的两台设备,每台设备都是独一无二的。可以通过抓取用户手机上的一些特征,形成一个特征编码,这就是“设备指纹”。通过设备指纹,可以判断同一台设备,注册了多少账户,登陆了多少账户,是从设备角度进行判断的一个重要手段。

同样,欺诈分子在对抗中也逐渐在升级。欺诈分 子也开发出了诸如008神器、海马玩等软件,可以一键修改设备相关信息,来以此绕过设备指纹。针对欺诈分子的工具,可以通过作弊软件识别、冷门信息算法。 所谓作弊软件识别,市面上很多作弊软件,都是通过同一框架进行开发,因此可以加入对这个框架的识别,来判断是否使用了作弊。而冷门信息算法,则是抓取一些 欺诈分子没有注意到的地方,例如传感器的某些信息,例如蓝牙、电池、音乐排序、网卡生产商的某些信息来组成算法,对欺诈分子在修改时不注意的这些地方进行 判断。

四、位置数据 需要用户授权

位置数据主要使用GPS进行判断,需要用户授权。位置数据可以有多种使用方式:

  • 定期调取GPS,以此来判断工作地址和家庭地址,与进件资料作比对,看用户是否包装资料。
  • 活动环境位置,用户经常在一些不良场所活动,例如赌场、夜店活动,说明此人可能有不良习惯。
  • GPS移动异常:可以根据用户的GPS移动距离计算,例如1小时前在上海,1小时候在北京,则有GPS造假可能。
  • 相同GPS:同一位置多笔申请借款,说明有欺诈嫌疑。多台设备同一GPS,说明设备之间有关系,可以作为关联欺诈的判断。

五、APP数据 慎重!小心侵犯用户隐私

可以探测用户的APP列表。如果存在大量贷款类APP,则说明用户对资金需求强烈。同样,如果用户手机没有其他APP,则说明该设备可能用来欺诈。如果探测到安装有模拟器类、GPS伪造类,说明用户有欺诈可能。

对用户的APP数据进行采集,实际侵犯了用户隐私。请慎重。

六、设备账户信息 若采集到APP上的用户名

在设备上还可以采集到APP的用户名。以此来建立用户名与设备之间的关系,同一个APP存在3个以上的用户,则说明该设备有盗账户嫌疑。其他APP账户与业务申请吻合,则可以对该账户一个较高信任分数。同样,该类数据采集也是对用户隐私的严重侵犯。

七、通讯录数据 通讯录数据需要用户授权

通讯录数据需要用户授权。对通讯录信息的获取,可以防止欺诈关系圈。有几种情况:

1、 通讯录为空,说明该设备有欺诈嫌疑。

2、 通讯录内容,可以形成关系,作为关联欺诈的一个重要判断。

3、 通讯录名称标识,可以通过社交关系信用过判断本人信用。

“通讯录数据也是严重侵犯用户隐私的行为。”

八、设备关系数据 多维度进行

  • 相同WIFI:两个设备多次出现在同一WIFI下,则说明设备之间有关系。出现次数越多,关系越强。
  • 蓝牙配对:蓝牙配对记录的采集,可以获得两台设备的关系。
  • GPS:前文已说过,同一GPS出现的设备,说明设备有关系。
  • 通话记录数据:通过通讯录、通话记录可以得到关系数据,而且可以根据通讯录名称直接标明关系。


      综上,可以从多个角度的数据进行分析,对潜在的欺诈行为进行判定。其中部分数据,需要考虑到用户的授权。如果用户未进行授权,在借贷业务上,则可以对该进件进行降分处理。另外,部分数据能否采集,还需遵循国家相关规定,同时要保护好用户隐私。


公司活动派发小礼品毛绒玩具批发   投稿&广告投放
参与评论
米粒博客
米粒博客 1年前 (2016-08-13)

都没安全感!

回复Ta
admin
古月 1年前 (2016-08-14)

回复Ta
卢松松博客
卢松松博客 1年前 (2016-08-11)

从百度点进来的,支持一下,希望站长您多出一些好文章。

回复Ta