数据“保险”升级!快来了解如何更轻松的实现 Cloud Storage 数据去标识化

如何对数据进行加密保护处理一直是企业面临的难题之一,这需要有效的流程和技术来删除或混淆存储数据中的某些敏感信息。实现这一目标的一个重要工具就是“去标识化”。NIST 将其定义为“从数据集中删除识别信息,从而使个人数据无法与特定个人相关联的技术。去识别化可以降低与收集、处理、归档、分发或发布信息相关的隐私风险。”


为了让 Cloud Storage 的去标识化变得更加容易,不得不提到 Cloud DLP 服务以及全新升级的云存储的去标识化功能。现在,我们无需运行自己的管道或自定义代码就可以对 Cloud Storage 对象、文件夹和存储桶进行去标识化。此外,我们还可以通过添加一种新的字典替换方法来增强转换,帮助完成更强大的隐私保护——尤其是对于一些非结构化数据,比如客户聊天日志等。


新升级的“去识别发现”行动


Cloud DLP 检查作业的“去识别化结果”操作是一项完全托管的功能,可创建被检查数据对象的去识别化副本。这意味着您可以检查 Cloud Storage 存储桶中的个人身份信息 (PII) 等敏感数据,然后在控制台 UI 中单击几下即可创建这些对象的编辑副本。无需编写自定义代码或管理复杂的管道,并且由于它是完全托管的,它会为您自动扩展,而无需您管理配额。



此新操作支持以下数据类型:

  • 文本文件
  • 逗号或制表符分隔的值
  • 图片

(地区限制参考:https://cloud.google.com/dlp/docs/locations#location-specific_limitations


启用后,DLP 作业将对数据进行检查,并将所有受支持文件的去识别副本生成到输出存储桶或文件夹中。


您还可以在作业触发器上使用新的去识别化操作来自动去识别出现在重复计划中的新内容。这对于创建具有安全放置区的工作流非常有用,用于在可访问之前需要取消识别的传入文件。



自动去标识能做什么?


Cloud DLP 提供了一组转换技术来对敏感数据进行去标识化,同时尝试使数据对您的业务仍然有用。这些技术包括:


  • 编辑:删除全部或部分检测到的敏感值。
  • 替换:用指定的代理值替换检测到的敏感值。
  • 掩码:将敏感值的多个字符替换为指定的代理字符,例如井号 (#) 或星号 (*)。
  • 基于加密的标记化:使用加密密钥加密原始敏感数据值。Cloud DLP 支持多种类型的标记化,包括可以反转或“重新识别”的转换。
  • Bucketing:通过将敏感值替换为一系列值来“概括”敏感值。(例如,将特定年龄替换为年龄范围,或将温度替换为与“热”、“中”和“冷”相对应的范围。)
  • 日期偏移:将敏感日期值偏移随机时间量。
  • 时间提取:提取或保留日期和时间值的指定部分。



新字典替换方法


当找到敏感数据元素时,字典替换将其替换为从您提供的单词列表中随机选择的值。如果您希望编辑后的输出具有更真实的代理值,则此转换方法特别有用。


考虑以下示例:您收集客户支持聊天日志作为向客户提供服务的一部分。这些支持聊天日志包含各种类型的个人身份信息 (PII),包括人名和电子邮件地址。Cloud DLP 可以使用“[REDACTED]”等静态替换来查找敏感元素并对其进行去标识化,以帮助防止有人看到这些敏感数据。


使用新的字典替换方法,您可以用从字典中随机选择的值替换这些发现。与静态替换相比,此字典替换提供了两个关键优势:

  1. 生成的输出看起来更真实
  2. 因为输出看起来更真实,它可以帮助隐藏任何残留的名字(一种隐私去识别技术,有时被称为“hiding in plain sight”)


-示例-

输入:

[Agent] 你好,我叫Jason,可以告诉我你的名字吗?

[客户] 我的名字是瓦莱里亚

[代理] 如果我们需要联系您,您的电子邮件地址是什么?

[客户] 我的电子邮件是v.racer@example.org

[代理] 谢谢。我怎么帮你?


去识别的输出:

[Agent] 你好,我叫Gavaia,可以告诉我你的名字吗?

[客户] 我的名字是Bijal

[代理] 如果我们需要联系您,您的电子邮件地址是什么?

[客户] 我的邮箱是happy.elephant44@example.org

[代理] 谢谢。我怎么帮你?



正如您在输出中看到的那样,姓名和电子邮件地址已被替换为一个随机值,既保护了原始敏感信息,又使输出看起来更真实。这可以使数据更有用,并有助于“隐藏”任何残留的 PII。


📍要了解有关去标识化的更多信息,请参考技术文档https://cloud.google.com/dlp/docs/transformations-reference#dictionary-replacement


———

WebEye是中国大陆地区首家获得 Google Cloud MSP 资质的合作伙伴。WebEye致力于用创新的技术向中国企业提供数字化效率创新服务,实现数字化赋能。我们不断帮助客户打造新的运营与协作方式,打造新的竞争优势,构建资源高效链接,共创价值生长空间。

WebEye整合全球资源,打造全球数字化营销体系,为企业提供营销增长服务营销增长引擎以及企业上云三大板块业务,涵盖数字营销、数字创意、游戏发行、流量变现、程序化广告、数据洞察、云计算等一站式全链条增长产品矩阵,是中国互联网出海领军企业。


返回全部