Remove PII from CSV Files(CSV 文件个人信息自动脱敏)
该工作流自动监控 Google Drive 文件夹中的新 CSV 文件,一旦检测到新文件即启动流程。它利用 OpenAI 智能识别个人身份信息(PII)列,并自动删除这些敏感数据,生成脱敏后的文件并重新上传到指定文件夹。整个过程高效、智能且无需人工干预,有效降低了数据泄露风险,适合需要批量处理隐私数据的企业和团队。
流程图

工作流名称
Remove PII from CSV Files(CSV 文件个人信息自动脱敏)
主要功能和亮点
该工作流能够自动监控指定的 Google Drive 文件夹,当有新的 CSV 文件被创建时,自动触发流程下载文件,利用 OpenAI 智能分析表格数据,精准识别其中包含的个人身份信息(PII)列,然后自动剔除这些敏感列,生成脱敏后的 CSV 文件并上传回 Google Drive 指定文件夹。整个过程无需人工介入,实现高效、智能且安全的数据脱敏。
解决的核心问题
在数据共享和处理过程中,如何快速准确地识别并去除包含个人隐私信息的字段,避免数据泄露风险,保障数据合规性。特别适合需要批量处理大量 CSV 文件且对数据隐私有严格要求的场景。
应用场景
- 企业数据团队需要定期共享客户或员工数据,但必须去除敏感信息。
- 数据分析师在使用第三方工具前,自动清洗数据中的个人身份信息。
- 合规部门监控和处理包含敏感信息的文件,确保符合隐私保护法规。
- 自动化办公环境中,帮助降低人工操作风险,加快数据处理效率。
主要流程步骤
- Google Drive Trigger:实时监控指定文件夹中新建的 CSV 文件。
- 获取文件名和下载文件:提取文件名并下载文件内容。
- 提取文件数据:解析 CSV 文件内容,准备数据供后续处理。
- OpenAI 分析:调用 GPT-4 模型,智能识别包含个人身份信息(PII)的列名。
- 数据合并:将 OpenAI 识别结果与原始数据合并。
- Remove PII columns(代码处理):根据识别出的 PII 列名,删除对应字段,生成脱敏数据。
- 上传到 Google Drive:将脱敏后的 CSV 文件上传至指定文件夹,文件名带有“_PII_removed”后缀,方便区分。
涉及的系统或服务
- Google Drive:文件监控、下载及上传。
- OpenAI GPT-4:智能识别包含个人身份信息的列。
- n8n 自动化平台:流程管理与执行。
适用人群或使用价值
- 数据处理人员、数据分析师、合规与隐私保护团队。
- 企业或组织中需要自动化处理和脱敏大量结构化数据的用户。
- 希望借助 AI 技术提升数据安全和合规水平,减少人工干预和误操作风险的团队。
- 希望构建智能、高效、可扩展的数据脱敏自动化工作流的技术人员。
该工作流通过无缝集成 Google Drive 和 OpenAI,实现了智能化的 CSV 文件隐私保护方案,显著提升了数据处理效率与安全性,是数据合规管理的有力助手。