首页 > 热点资讯 >新闻内容

数据脱敏——什么是数据脱敏

2021年06月02日 12:06

一、什么是数据脱敏


数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。

百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。

生活中不乏数据脱敏的例子,比如我们最常见的火车票、电商收货人地址都会对敏感信息做处理,甚至女同志较熟悉的美颜、有些视频中的马赛克都属于脱敏。


二、为什么要进行数据脱敏


上面说到,在“涉及客户安全数据或者一些商业性敏感数据的情况下”对数据进行改造,说明我们要进行改造的数据是涉及到用户或者企业数据的安全,进行数据脱敏其实就是对这些数据进行加密,防止泄露。

对于脱敏的程度,一般来说只要处理到无法推断原有的信息,不会造成信息泄露即可,如果修改过多,容易导致丢失数据原有特性。因此,在实际操作中,需要根据实际场景来选择适当的脱敏规则。改姓名,身份证号,地址,手机号,电话号码等几个客户相关字段。

三、如何实现数据脱敏


按照脱敏规则,可以分为可恢复性脱敏和不可恢复性脱敏。可恢复性脱敏就是数据经过脱敏规则的转化后,还再次可以经过某些处理还原出原来的数据,相反,数据经过不可恢复性脱敏之后,将无法还原到原来的样子,可以把二者分别看做可逆加密和不可逆加密。

我们目前遇到的场景是日志脱敏,即在把日志中的密码,甚至姓名、身份证号等信息都进行脱敏处理。

脱敏前:


脱敏后:

如上图,仔细分析会发现,打日志之前,获得脱敏的数据就两个步骤:【拿到要输入的数据(user实体)】→【进行序列化】,所以要进行数据脱敏可以考虑在这两个步骤上进行实现。第一个方法就是在序列化实体之前先把需要脱敏的字段进行处理,之后正常序列化;第二个方法就是在实体序列化的时候,对要脱敏的字段进行处理。


相关推荐

该怎么来做百家号SEO呢?具体方案如下

众所周知,百度系产品在最近几年频频出现大动作,先后上线手百,百家号,百度小程序,百度知道,知道合伙人,好看视频等,从内容到视频做了完美布局,抢滩流量市场。截至2020年9月30日百度App日活跃用户数(DAU)达2.06亿,月活跃用户数(MAU)达5.44亿。这个体量足以完爆国内任何一家搜索引擎公司,不仅仅只是华丽的数据符号,这些更是无形的数据资产,代表变现财富。在DT时代,可以简单用这个公式概括下(这些就代表资产,变现的前置条件之一):数据=资产。毫无疑问,百度在挖掘流量上形成了压倒性的优势占据榜首,目前围绕百家号打造的百度生态系产品更是形成了前所未有的营销生态闭环,大力扶植创作者,以文字+视频的方式去中心化运营,搭载百度知道、直播、视频的方式输出进行带货,牢牢锁死用户在这个圈子里完成所有动作。那么,今天所说的是百家号作为百度生态系产品枢纽,我们如何能快速突破百家号SEO?「优联互通」最近与「租客网」合作,使用了新的算法,感兴趣的可以直接在手机端搜索:深圳租房、房屋租赁,「租客网」目前排在首页第7位。那么,究竟该怎么来做百家号SEO呢?具体方案:1.注册百家号先下载百家号及注册,有一个百度账号也可以通用,具体教程可以参考「优联互通」公众号。2.改造百家号百家号注册成功后需要绑定网站或者小程序,在填写设置好相应的参数配置,步骤简化,步骤1和2是必须要填写的,其他的可以视情况选择。3.做好内容布局,不要发布百度内部敏感信息这是做好百家号SEO的核心点,百家号前期的注册类型及从事领域就决定你的号在行业中是否能走得很远,比如:我是做餐饮行业的,但是在内容输出这块就尽量以餐饮及周边的内容为主,不要张冠李戴,不然在内容输出后审核会不推荐的,这个很重要。4.利用百家号SEO内参数据工具最后利用百家号SEO内参工具,查找有SEO优化的机会的关键词,一一筛选,具体筛选思路(如需找到有SEO占位机会的百家号数据)有两种机会:·没有百家号,但是指数变化突然暴涨的·有百家号,指数变化突然暴涨,但是是泛匹配最后在筛选项中进行目标过滤,例如:排名小于等于30;不存在百家号或存在百家号。当然,以上所列举的,仅是简单快速突破百家号seo瓶颈优化方式,大家可根据自己的需求,调整自己的目标,精准的找到心中想找的。

2021年05月24日 10:32

公司怎么做好SEO关键词优化

公司怎么做好SEO网站优化?现如今,很多公司都会建设自己的网站,以此来宣传自己,但是很多公司不知道优化的重要性,从而网站没有很好的排名,下面来告诉你怎么优化网站。  1、内部优化  当前,随着搜索引擎算法的多样化和复杂性,内部优化在搜索引擎优化中的地位日益重要。内部优化主要包括以下几个方面的优化:关键字优化,URL优化,代码优化,网页结构优化和网站结构优化。关键字优化是最基本,最重要的内部优化。它确定是否有更多用户可以找到相应的关键字,并使网站的目标关键字在特定搜索引擎上获得更好的排名。  2、注意用户体验  对于公司网站,构建网站的主要目的是让用户找到所需的信息,并吸引客户访问并增加网站的关注度。从建设的初始阶段开始,网站就域名选择,网站结构,网页样式和代码编写方面一直致力于精简和清晰。不要使用会影响网页打开速度的大量动画效果或元素,以便用户可以轻松地打开网页并快速找到所需的信息。  3、关键字研究  关键字的选择决定了网站的主要任务,以便在搜索引擎上获得良好的排名。因此,对于专业的seo研究人员而言,研究关键字是用户找到自己的网站的重要指标,可以显着提高网站的访问量和排名。  上述分享了怎么做好SEO网站优化的一些方法,当然优化的方法肯定不止这些,网站优化是通过我们不断的分析搜索引擎的抓取规律,从而来提高网站的排名,达到希望上面的几点可以帮助到你,可以找广东优联互通科技有限公司,10年优化优化经验,白帽技术正规技术,可以联系13539285443

2020年12月09日 10:27

影响蜘蛛抓取页面的因素都有哪些

seo一般有两个需要做:一个是站内优化,另一个是站外优化,这样效果才能更好!站内优化:关键字优化,内容优化,标签优化,标题标签优化,关键字和原始文章增加,这对SEO来说是十分必要的。站外优化:要做友联,外链的添加,针对站点里边的产品,服务,特征等进行优化操作。网站收录与百度蜘蛛有着直接的关系,我们平时主要是通过主动或被动的方式来吸引百度蜘蛛抓取网站页面。主动的方式就是通过站长平台的链接提交工具或其它插件,来将自己网站新的内容链接提交给搜索引擎。被动的方式是靠搜索引擎蜘蛛自己来爬取,来的时间不一定。百度蜘蛛有两个目标:一个是本网站生成的新网页,另一个是百度之前已抓取但需要更新的网页。影响百度蜘蛛抓取网站页面的因素有哪些1、robots协议设置:网站上线后roblts协议文件是搜索引擎第一个查看的文件,如果不小心设置错误禁止搜索引擎就会导致,搜索引擎蜘蛛无法抓取网站页面。2、内容质量此外,网站内容的质量也非常重要。如果蜘蛛在我们的网站上抓取了100,000条内容,并且只构建了100条或更少的内容,那么百度蜘蛛也会减少网站的抓取量。因为百度认为我们的网站质量很差,所以没有必要抓住更多。因此,我们特别提醒您在站点建设之初需要注意内容的质量,不要收集内容。这对网站的发展有潜在的隐患。3、服务器不稳定:服务器不稳定或者JS添加过多,就会导致网站加载速度变慢,甚至无法打开,严重影响用户体验,这种情况也会影响百度蜘蛛抓取网站页面的。4、网站安全对于中小型站点,由于缺乏安全技术意识和技术弱点,网站被篡改是很常见的。有几种常见的黑客攻击情况。一个是网站域名被黑客攻击,另一个是标题被篡改,另一个是页面中添加了很多黑链。对于一般网站,域名被劫持,即域名设置为301跳转,并跳转到指定的垃圾邮件网站。如果百度发现这种跳跃,那么你网站的抓取就会减少,甚至会减少惩罚。5、网站响应速度快①网页的大小将影响抓取。百度建议网页的大小不到1M,当然类似于新浪网这样的大型门户网站。②代码质量,机器性能和带宽。这些会影响抓取的质量。不用说,代码本身的质量也根据程序执行。您的代码质量差,难以阅读。蜘蛛自然不会浪费时间阅读。机器性能和带宽也是如此。服务器配置太差,带宽不足会导致蜘蛛抓取网站,这将严重影响蜘蛛的热情。6、具有相同ip的网站数量百度抓取是基于ip抓取的。例如,百度每天可以在ip上捕获2000w页面,并且该站点上有50W站点,因此将抓取平均站点数量。很少点。同时,你需要注意看同一个ip上是否有一个大站。如果有一个大站,那么分配很少的抓取数量将被大站带走。影响网站收录的因素是各方面的,在查找原因的时候可采用排查法,一项一项的查找,只有查找到了原因才能提升网站收录。同时提醒大家一点:搜索引擎的索引库是分级别的,网站内容被收录后,如果内容质量度高就会进入优质索引库,并给于优先展示,因此网站收录并不是量大就是好。

2020年03月14日 04:23