|
|
新闻中心
> >
相关内容
2020江苏高考作文题出炉大数据真的是原罪吗?
2020.07.07


  最后一年的江苏卷高考作文,献给了智能互联网大数据。
 

  而就在此时此刻,无数的人工智能算法人才,正在潜心研究如何获得更多的数据,如何提高对数据的利用能力,各大公司也在疯狂地招揽这些数据人才,扩展新的数据获取渠道。
 

  他们研究的成果,包围了我们所在的整个物理世界,数据在这个世界中见缝插针。
 

  爱在网上买什么商品?

  经常打车去哪些地方?

  爱吃哪里的饭?

  喜欢哪个idol?

  爱看什么类型的视频?

  ……
 

  无数的数据组成了你在这个世界里的画像,信息网络为你推送越来越精准的信息,提供越来越贴心的服务,也就出现了考题中所说,人们一直被同类信息所围绕,如何突破桎梏,塑造未来独特完整的自己的问题
 

  而大数据真的是原罪吗?它让我们成为了失去光芒的乌合之众?

  其实不然,大数据本身无罪,论罪与否要看我们人类如何利用。

  疫情期间,有外媒记者表示,自己只去过新发地附近拍照,也被大数据搜了出来,要求自己去做核酸检测。
 


 

  大数据在医疗行业能够发挥极大的作用,如果让我们提供数据来换健康,我想大部分人都会同意。
 

  和医疗行业相似,保险也可以利用数据。将繁多的个人信息收入囊中,这样保险行业才能根据不同的人、不同的情况制定不同的保额。这表面上看起来风轻云淡的背后,其杀手锏就是“大数据”。那么保险行业,如何在不泄漏客户个人隐私数据,让客户放心把数据提供给公司的同时,利用好数据发挥其价值呢?最近观安信息在某知名保险企业的静态脱敏实践,可以为大家提供一些思路。
 

  行业现状:

  保险行业由于其行业属性,包含了寿险、财险、外资保险等业务,存储着大量客户个人隐私数据,如银行账户、社保、疾病等信息。这些数据一旦泄漏,被不法分子利用对于保险客户的短信骚扰、电话诈骗,从而对保险公司的声誉和经济利益造成损害;甚至有公司通过营业分析发现业绩直线下滑和周边客户被竞品公司挖走现象,通过监控手段发现存在部分客户信息被泄漏情况。
 

  法规行规要求:

  《网络安全法》第四十二条:网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。网络运营者应当采取技术措施和其他必要措施,确保其收集的个人信息安全,防止信息泄露、毁损、丢失。在发生或者可能发生个人信息泄露、毁损、丢失的情况时,应当立即采取补救措施,按照规定及时告知用户并向有关主管部门报告。

  内部数据安全管理要求:企业内部有客户数据安全管理制度规范,由数据管理部制定,确定通过数据分类分级等基础数据安全方案建设,使客户数据这一核心资产得到更加有效合理的保护,其中第3章客户数据安全管理制度规范3.1客户数据分类分级与第4章客户数据安全技术防护措施应用4.3.1数据脱敏。
 

  相关信息安全规范指引:

  【1】数据安全能力建设实施指南V1.0(征求意见稿)

  【2】GB/T35273-2017 信息安全技术个人信息安全规

  【3】GBT22239-2019 信息安全技术信息系统安全等级保护基本要求

  【4】JRT0158-2018 证券期货业数据分类分级指引
 

  场景介绍
 

  某大型保险公司要求业务系统每次发布必须进行性能、功能测试,但业务系统中客户隐私数据和交易数据需要脱敏迁移。测试和内部开发应用程序以及 DBA 工具中的敏感信息限制访问权限的成本异常高昂,极为耗时,每次均为数据库管理员手动执行脚本完成脱敏,但是无法满足测试数据的一致性和敏感数据操作审计要求,需要对生产数据迁移进行自动化脱敏以满足测试业务和信息安全审计需求。
 

  生产数据提取步骤
 

  测试部门根据每次发布需要,通过工单告知数据库管理员进行数据提取,数据库管理员根据工单要求编写脚本,手工的在正式和测试环境中进行数据迁移。每次需迁移近1个月生产环境数据,在50G~1T数据之间。
 


 

  手动脚本脱敏缺点
 

  ① 脱敏方式易破解,已有的MD5加密方式被人利用工具破解;

  ② 脚本排查成本高,需要每天核对脚本和二次结果确认,人工投入量较大;

  ③ 文件同步成本高,脱敏结果上传无法进行同步,影响使用方使用效率。
 

  脱敏难点与挑战
 

  01 两地三中心灾备方式

  网络安全法规定数据库需要容灾备份的数据服务设计要求,脱敏系统需支持分布式部署
 


 

  02 高可用要求

  每年的BCP (Business Continuity Planning,业务连续性计划)检查,对系统有高可靠性的要求,脱敏系统需支持高可用
 

  03 安全域网络隔离

  安全域使组内暴露风险最小化,在发生网络攻击等侵害时能将威胁最大化的隔离,减少域外事件对域内系统的影响。分为运管区、app应用区、生产区、测试区,互不联通,部分数据传输端口作为高危端口,不可开通,测试区与其他区隔离,这就要求脱敏系统能够对网域进行管理,根据数据所在网域执行脱敏任务
 

  04 文件类型脱敏

  保险行业不仅数据量大,数据存储格式也很丰富,需要支持对文件的脱敏,如dump文件、CSV文件、excel文件等
 

  05 多表SQL语句抽取

  提取数据需求中,多为对多表进行关联提取,需要支持SQL语句抽取数据子集(含多表)
 

  06 视图、同义词脱敏

  为了更快捷地获取数据,用户只需访问视图中的数据,不需要根据每张数据表来查看数据,简化了操作,也不需要知道表、字段信息,避免了信息泄露
 

  解决方案
 

  1、支持分布式部署
 


 

  2、高可用方案

  数据脱敏平台通过F5实现web访问和处理节点访问的负载均衡,实现前端和管理处理双活的,保障了当任意前端、管理节宕机后,访问流量均可以通过F5调度到其他前端、管理节点。
 


 

  3、网域管理

  跨网段读取数据时速率会降低,并且影响带宽,需要对各个网域的服务器进行集中管理展示。
 


 

  数据脱敏系统方案优点
 

  01 自动化脱敏流程的应用
 


 

  02 保证数据业务一致性

  如果表与表之间存在关联关系,脱敏后数据应保持业务一致,表与表之间依然存在关联关系。
 


 

  03 保持原有数据属性和数据真实性

  脱敏后的数据,依然能通过业务校验,不影响数据分析,如:

  身份证号码脱敏,依然是身份证号格式,并且支持校验位校验

  电话号码脱敏,依然是本地电话号

  工商识别号脱敏,依然在年龄段内

  地址脱敏,依然在所属的省市区内

  银行卡号脱敏,依然是所属银行的卡号

  ……
 

  04 支持多种数据脱敏模式

  支持原库脱敏、库到文件脱敏、异库脱敏、文件到库脱敏,支持dump、CSV、TXT、Excel文件类型的脱敏。
 

  05 原有SQL语句的灵活运用

  支持通过SQL语句抽取数据子集,包括多表联查、字段过滤、行数过滤等。
 

  06 支持视图、同义词脱敏

  数据库在使用时,本身会有许多便捷访问查询的功能,比如视图、同义词,对视图、同义词脱敏后进行访问,既能满足数据查询的需要,又能防止表名、字段名等带来的信息泄露。
 

  客户收益:

  ① 满足安全合规和保监会等审计要求

  ② 保护敏感信息不被泄漏的同时保证数据可用性

  ③ 减少人工成本,提高脱敏效率,减少漏脱数据
 

  以上就是静态脱敏在保险行业的应用与实践。
 

  观安数据安全技术

  为您安全合规使用大数据

  保驾护航!

分享至: