Remove PII from CSV Files(CSV文件敏感信息自动清理)
该工作流自动监控Google Drive文件夹中的新CSV文件,下载并提取内容。利用人工智能智能识别文件中的个人身份信息(PII)列,并通过自定义代码自动移除这些敏感信息,最后将脱敏后的CSV文件重新上传。这一过程大幅提升了数据脱敏的效率与准确性,帮助用户合规处理敏感数据,有效避免隐私泄露风险,适用于企业数据共享与法律合规需求。
流程图

工作流名称
Remove PII from CSV Files(CSV文件敏感信息自动清理)
主要功能和亮点
该工作流自动监控指定的Google Drive文件夹,一旦有新的CSV文件上传,即自动下载文件并提取内容,利用OpenAI智能识别其中包含的个人身份信息(PII)列,随后通过自定义代码节点从数据中移除这些敏感信息列,最后将脱敏后的CSV文件重新上传至指定的Google Drive文件夹,实现了CSV文件的智能敏感信息识别与快速脱敏处理。
解决的核心问题
在数据共享和处理过程中,手动识别和移除个人身份信息(PII)既繁琐又易出错。该工作流利用AI智能自动检测PII列,大幅提升数据脱敏效率与准确性,帮助企业和个人合规处理敏感数据,避免潜在的隐私泄露风险。
应用场景
- 企业数据共享前的敏感信息自动清理
- 法律合规要求下的客户数据脱敏
- 数据分析和处理前的隐私保护
- 大量CSV文件批量处理与自动化工作流构建
主要流程步骤
- Google Drive Trigger:实时监控指定文件夹中新上传的CSV文件。
- 获取文件名和下载文件:自动提取文件名并下载文件内容。
- 提取文件内容:解析CSV文件的表格数据。
- 调用OpenAI模型:智能分析表头,识别包含PII的列名。
- 合并数据:将文件内容、文件名及PII列信息合并。
- 敏感信息清理代码节点:基于识别结果,删除PII列,生成脱敏后的CSV数据。
- 上传至Google Drive:将脱敏后的文件以新的文件名上传回指定文件夹,完成全流程自动化。
涉及的系统或服务
- Google Drive:文件的监控、下载与上传操作。
- OpenAI GPT-4o-mini模型:智能识别CSV中的个人身份信息列。
- n8n自定义代码节点:实现敏感信息列的删除和CSV格式转换。
适用人群或使用价值
- 数据安全与合规团队:自动脱敏敏感数据,降低人工工作负担。
- 数据分析师和数据工程师:快速获得无敏感信息的清洁数据。
- 企业IT和自动化开发者:构建符合GDPR等隐私法规的数据处理流程。
- 任何需要批量处理和共享CSV数据的组织或个人,提升数据处理效率与安全性。