数据安全方案之数据脱敏方案|数据库脱敏方案
日期:2020-03-06 19:25:59 / 人气:
微软雅黑; font-weight: bold;">数据脱敏架构
灵活的数据脱敏方式
预设丰富的敏感信息
敏感数据自动发现
支持脱敏算法
保持数据间的逻辑关系
数据子集及黑名单功能
白名单功能
数据依赖脱敏、特征脱敏
多域脱敏、一致性脱敏
计算脱敏
脏数据智能处理
部署模式
产品定义与理解
常见场景
场景一:开发、测试环境脱敏
场景一:解决方案
场景一:解决方案
场景二:大数据平台脱敏
场景二:解决方案
场景二:解决方案
场景总结
产品定义与理解
.一款面向敏感数据进行数据自动发现、数据脱敏的专业的数据安全脱敏产品。
.实现自动化发现源数据中的敏感数据,并对敏感数据按需进行漂白、变形、遮盖等处理,避免敏感信息泄露。
.同时又能保证脱敏后的输出数据能够保持数据的一致性和业务的关联性。
在限制隐私数据泄露风险在一定范围内的同时,最大化数据分析挖掘的潜力,释放数据价值
.一款避免敏感信息泄漏的工具
.一款自动发现敏感数据的工具
.一款可对敏感数据进行“变形”的工具
.通过脱敏规则进行数据变形,克隆一份“高保真”的假数据,实现敏感隐私数据的可靠保护
法规环境
《中华人民共和国网络安全法》
《中国银行业“十二五”信息科技发展规则监管指导意见》
《银监会信息科技风险现场检查指南》
“加强数据、文档的安全管理,逐步建立信息资产分类分级保护机制。完善敏感信息存储和传输等高风险环节的控制措施,对数据、文档的访问应建立严格的审批机制。对用于测试的生产数据要进行脱敏处理,严格防止敏感数据泄露。”
“测试中如需使用生产数据,应对相应数据进行脱敏、变形处理,当使用生产数据测试时是否得到高级管理层的审批并采取相关限制及进行脱敏处理。”
《网络安全等级保护基本要求》
“应当采取技术措施和其他必要措施,确保其收集的个人信息安全,防止信息泄露、毁损、丢失。”
“网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。”
“大数据平台应提供静态脱敏和去标识化的工具或服务组件技术”
“应在数据分类分级的基础上,划分重要数字资产范围,明确重要数据进行自动脱敏或去标识的使用场景和业务处理流程。”
常见场景
05.溯源和水印
.当数据流动到外部机构时,数据安全就失去了控制。作为数据提供方,需要提供溯源机制,当发生数据泄露的时候,可以知道数据泄露在哪个环节发生。
04.数据共享
.当我们需要利用第三方机构的数据分析和处理能力来增加数据的价值时,需要满足监管机构的要求
03.数据交换交易
.处于边界的交换系统直接接触生产数据风险巨大
.数据上报过程很可能涉及隐私数据
.数据交易的过程中对隐私数据脱敏从而合规
01.开发、测试
.使用数据最频繁的场景
.每次对数据都有不同的需求
.对数据原始特征和数据之间的逻辑关系非常敏感
02.大数据平台
.大数据平台接入的数据中一般包括很多用户的隐私和敏感信息
.由于大数据业务的特殊性,无法通过传统的加密或权限控制来保护数据
数据审核任务
.场景描述
.开发、测试、数据分析、员工培训等环节都需要数据副本,从安全生产系统到非安全的测试环境,测试系统往往会采用真实生产系统数据。
.开发环境与测试环境采用物理隔离,测试库安全措施缺乏。
.大多数单位建立专门的测试库,通过手工/脚本方式进行数据脱敏。
.风险分析
.直接从生产库进行数据脱敏,影响生产业务;
.脚本质量影响数据质量,风险不可控且无法管理;
.测试成本高昂且效率低下;
场景一:解决方案
DMP获取方式:
1.通过选择ftp远程获取dmp文件;
2.本地通过ftp上传到脱敏服务器;
3.直接页面上传方式加载dmp文件
优势:
1、隔离生产系统、确保生产安全.隔离脱敏平台访问生产.数据库账户密码变更问题.作业消耗海量生产资源
2、无需改变日常工作模式
3、安全完备的数据分发
4、适应非现场测试
场景一:解决方案
.原库脱敏针对同一个数据库内的数据对象,直接脱敏。
.原库脱敏,无需改变日常工作模式,对生产无干扰。
.原库脱敏,和生产备份系统之间隔离,不增加日常负担。
脱敏后数据
.常规数据脱敏,和生产备份系统之间关联度很高;
.生产备份数据库需要定期变更账户密码,变更密码的同时,需变更脱敏平台连接账户的密码,增加管理复杂性;
场景二:大数据平台脱敏
结构化数据
大数据应用平台
通用脱敏算法
行业脱敏算法
个性化脱敏算法
隐私数据保护
大数据分析应用
通用脱敏算法
行业脱敏算法
个性化脱敏算法
数据脱敏策略管理
敏感性评估知识库
数据敏感性评估
数据发现管理
大数据共享
非结构化数据
大数据支撑能力(HDFS、MapReduce、HBASE、Hive)
商业数据库ORACLE…
开源数据库Mysql\Pgsql\Redis…
场景二:解决方案
.应用场景:
.数据脱敏的其中一个场景就是为了避免将数据提供第三方或内部人员进行数据分析时所带来的主体信息泄露风险。
.由于将主体信息进行了脱敏,在得到分析结果后无法匹配对应的真实主体。这时,就需要复敏功能,将脱敏的主体信息还原为真实的主体信息,最终发挥数据分析的价值。
.实现手段:
.脱敏系统作为一款安全软件,对于脱敏算法有非常严格的安全要求,必须做到脱敏后的数据不可通过算法进行逆向还原。
.我们通过将数据原值与脱敏后值的映射关系在脱敏系统中记录的方式,实现了脱敏数据的真实还原。
.同时系统对于复敏操作做了严格的权限控制,只有复敏操作员且拥有相应数据的复敏权限才能进行操作,最大程度保证了复敏操作的安全性。
场景二:解决方案
场景总结
.主要功能模块:dmp备份文件脱敏、原库脱敏、多数据源脱敏、数据复敏等
.使用场景:
.开发测试环境脱敏:存dmp备份文件脱敏、原库脱敏
.大数据平台脱敏:多数据源支持、数据复敏
通过配置过滤条件的方式形成数据源的白名单列表,并在脱敏源中勾选“白名单”过滤即可。解决了敏感数据脱敏后无法与外部数据进行联调的问题,从而保证了测试场景的完整性。脱敏后
一个字段内包括身份证、军官证和护照等数据集合时,支持按照不同的数据特征采取不同的脱敏规则进行脱敏。
支持有依赖字段的敏感信息脱敏(如字段“用户证件”的值包含身份证、军官证、护照等,通过依赖字段“证件类型”可进行判断)。
多域脱敏、一致性脱敏
脱敏后
支持多域类型的敏感信息脱敏(将多种类型的敏感数据拼装成一个字符串进行存储,例如:联系方式中的手机号码与固定电话。
同一张表中,两个字段具有包含或其他逻辑关系,如身份证和出生日期、城市和行政区等字段。在脱敏时能保证两个字段的数据一致性。
脏数据智能处理
当遇到脱敏源有脏数据时,系统会在检测到脏数据后将数据记录下来并跳过(或者自动对脏数据进行处理),继续处理剩余数据,提高系统稳定性。
支持断点续传和作业定时启停,当脱敏作业异常终止后,记录当前处理的记录点,再次启动后从之前的记录点开始,处理剩余未完成数据。
部署模式
支持集群方式
服务器集中进行数据脱敏服务,在客户端看来就像是只有一个服务器。集群可以利用多个计算机进行并行计算从而获得很高的计算速度,也可以用多个计算机做备份,从而使得任何一个机器坏了整个系统还是能正常运行。
支持多台单机部署方式
多台单机部署按照业务不同需求,配置不同数据脱敏设备进行脱敏设备,保证脱敏保证业务独立性。
.xx银行业务系统多、数据规模大,提高业务系统的开发代码质量,开发测试工作需要在高度仿真环境中进行,大量测试数据都来源于生产数据。
.三年前已采购过外资品牌的数据脱敏工具,但产品适用性无法满足银行内部的多样化数据脱敏要求,如Dump 至数据库的脱敏等。
数据安全合规需求
.根据《网络安全法》,中国银监会印发《银行业金融机构数据治理指引》要求,根据行业特征,数据治理工作需要将数据在测试环境进行验证。
数据脱敏主要对象
.脱敏对象主要围绕隐私身份信息和行业敏感信息展开,包括:客户姓名、身份证、组织机构名称、地址、电话、银行账户号、资金余额等。
.xx银行生产环境和开发环境的网络是独立的,美创数据脱敏一体机部署在开发环境网络内。
.生产环境数据,从容灾系统和生产系统共同获取,通过数据备份的方式,传递到开发环境。
.美创数据脱敏一体机,连接备份导入文件(导入备份文件名和备份位置),直接读取Dump文件内的数据对象,针对需要脱敏的数据对象,完成从Dump文件至开发库的直接脱敏。
.美创数据脱敏一体机,直接连接开发库,针对已经导入的数据,在同一个开发库内完成数据脱敏。
xx银行(续)
.数据库到数据库的不落地数据脱敏:美创数据脱敏一体机提供各种脱敏规则的实现和管理能力,数据从源端环境抽取经过设备内存处理后直接加载到目标环境,避免二度数据风险。
脱敏数据不落地
.客户组织架构较为复杂,内部业务部门较多,不同的部门都有自己的系统管理人员,对于脱敏系统均有一定的需求。美创脱敏系统具有多级管理功能,帮助用户实现不同部门的权限管理。
.安全部门需要管理整个公司所有的脱敏作业。管理难度较大。美创脱敏系统具有作业审批功能,通过:业务部门提交作业,安全部门审批的方式进行有效的管理。
支持多级管理与脱敏作业审批功能
.美创数据库脱敏系统支持DUMP文件到库的脱敏方式,用户无需将生产与开发测试平台互联,只需要将生产库中的数据导出为DUMP文件,并导入到脱敏系统中即可完成脱敏。
支持DUMP文件脱敏,原库脱敏
.根据国家颁布的《网络安全法》要求,实现敏感数据的保护。
.符合监管部门发布的《银行业金融机构数据治理指引》等相关法律规定。
符合监管部门法规要求
xx银行
.xx银行在生产区域部署了一套大数据平台,拥有几十个数据节点,储存了大量的生产数据和高度敏感数据。
.同时在大数据应有区域,也部署了一套大数据平台,主要负责数据分析、大数据挖掘、银行风控等应用。
.流入大数据应有区域的敏感数据,需要事先进行过脱敏处理。
.实现分布式大数据平台环境下的即时脱敏。
.实现大容量数据规模下的快速高效率脱敏。
.加强数据泄漏的内部风险控制,满足《银行业金融机构数据治理指引》等合规需要。
xx银行(续)
.大数据脱敏一体机,物理部署网络通畅的环境中,逻辑部署在两套大数据平台之间。
.大数据脱敏一体机,可以直接读取生产区域的Hive或Impala格式数据文件,经过脱敏后的数据,写入应用区域的Hive或Impala格式数据文件中。
.脱敏对象主要围绕隐私身份信息和行业敏感信息展开,包括:客户姓名、身份证、组织机构名称、地址、电话、银行账户号、资金余额等。
项目效果
.大数据不落地脱敏:美创大数据脱敏一体机提供各种规则的脱敏实现和管理能力,避免二度数据风险。
.支持分布式大数据和分布式大数据之间、数据库和分布式大数据之间、支持不同数据库类型之间、支持文本、Json、XML半结构化之间,支持半机构化和数据库之间等丰富场景下的数据脱敏。
.大数据脱敏,启用敏感数据自动发现功能,可以智能识别个人隐私、信用卡客户资料等信息。
声明:
1、江苏网术科技有限公司所提供产品全部为原厂正规产品,我司不出售翻新机,二手机,等残次品;硬件保修政策及时长按设备原制造厂执行,支持三包规定。
2、价格:官网上列出的价格为含增值税专用发票价格;硬件设备产品含税13%,工程服务含税9%,技术服务含税6%。
3、服务:网站标明的价格为商品本身含税价格,不含其它设定和安装服务;如需要安装设定服务请联系销售人员另行报价。无价格的商品为按需配置的项目商品,需联络销售人员报价。
4、方案:官网所述之方案非完整方案,且并不适用于所有的应用场景,请勿盲目套用。
5、新闻:大多摘自互联网,如有侵权,请与我们联系。
6、运费:苏州,无锡,南通,常州,泰州,镇江,扬州地区免费送货上门,其它地区快递发货。
7、结算:苏州,无锡,南通,常州,泰州,镇江,扬州地区支持账期和月结的结算方式,具体可与销售人员协商。其它地区均为现金结算。
8、其它:服务申明最终解释权归网术科技所有,其它未尽事项请与我们联系。