Remove PII from CSV Files(CSV 文件个人信息自动脱敏)
该工作流自动监控 Google Drive 文件夹中的新 CSV 文件,一旦检测到新文件即启动流程。它利用 OpenAI 智能识别个人身份信息(PII)列,并自动删除这些敏感数据,生成脱敏后的文件并重新上传到指定文件夹。整个过程高效、智能且无需人工干预,有效降低了数据泄露风险,适合需要批量处理隐私数据的企业和团队。
Tags
工作流名称
Remove PII from CSV Files(CSV 文件个人信息自动脱敏)
主要功能和亮点
该工作流能够自动监控指定的 Google Drive 文件夹,当有新的 CSV 文件被创建时,自动触发流程下载文件,利用 OpenAI 智能分析表格数据,精准识别其中包含的个人身份信息(PII)列,然后自动剔除这些敏感列,生成脱敏后的 CSV 文件并上传回 Google Drive 指定文件夹。整个过程无需人工介入,实现高效、智能且安全的数据脱敏。
解决的核心问题
在数据共享和处理过程中,如何快速准确地识别并去除包含个人隐私信息的字段,避免数据泄露风险,保障数据合规性。特别适合需要批量处理大量 CSV 文件且对数据隐私有严格要求的场景。
应用场景
- 企业数据团队需要定期共享客户或员工数据,但必须去除敏感信息。
- 数据分析师在使用第三方工具前,自动清洗数据中的个人身份信息。
- 合规部门监控和处理包含敏感信息的文件,确保符合隐私保护法规。
- 自动化办公环境中,帮助降低人工操作风险,加快数据处理效率。
主要流程步骤
- Google Drive Trigger:实时监控指定文件夹中新建的 CSV 文件。
- 获取文件名和下载文件:提取文件名并下载文件内容。
- 提取文件数据:解析 CSV 文件内容,准备数据供后续处理。
- OpenAI 分析:调用 GPT-4 模型,智能识别包含个人身份信息(PII)的列名。
- 数据合并:将 OpenAI 识别结果与原始数据合并。
- Remove PII columns(代码处理):根据识别出的 PII 列名,删除对应字段,生成脱敏数据。
- 上传到 Google Drive:将脱敏后的 CSV 文件上传至指定文件夹,文件名带有“_PII_removed”后缀,方便区分。
涉及的系统或服务
- Google Drive:文件监控、下载及上传。
- OpenAI GPT-4:智能识别包含个人身份信息的列。
- n8n 自动化平台:流程管理与执行。
适用人群或使用价值
- 数据处理人员、数据分析师、合规与隐私保护团队。
- 企业或组织中需要自动化处理和脱敏大量结构化数据的用户。
- 希望借助 AI 技术提升数据安全和合规水平,减少人工干预和误操作风险的团队。
- 希望构建智能、高效、可扩展的数据脱敏自动化工作流的技术人员。
该工作流通过无缝集成 Google Drive 和 OpenAI,实现了智能化的 CSV 文件隐私保护方案,显著提升了数据处理效率与安全性,是数据合规管理的有力助手。
Google Page Entity Extraction Template
该工作流利用谷歌自然语言API,自动提取任意网页中的命名实体,如人物、组织和地点,实现信息的结构化分析。用户通过Webhook提交网页URL,系统自动抓取内容并进行实体识别,返回详细的实体信息及其重要性评分。此工具特别适用于媒体监控、市场调研和数据集成等场景,极大地提高了信息处理的效率和准确性,帮助用户快速获取关键数据。
Extract text from PDF and image using Vertex AI (Gemini) into CSV
该工作流能够自动从Google Drive指定文件夹中新上传的PDF文件和图片中提取文本,通过Google Vertex AI和Openrouter AI进行智能识别与分析。提取后的交易数据将被转化为带有分类信息的CSV文件,并自动上传回Google Drive,从而简化了手动数据录入和分类的过程,提升了数据处理的效率和准确性,适用于财务管理和数据分析等多种场景。
Calculate the Centroid of a Set of Vectors(向量集合质心计算)
该工作流能够自动接收并处理多个向量,确保输入数据的维度一致性,计算出这些向量的质心,即各维度的平均值,并将结果以友好的格式返回。它有效解决了多维数据处理中的常见问题,适用于数据分析、机器学习及地理信息系统等领域,提升了数据处理的自动化和准确性。
AI Agent 与 Supabase/PostgreSQL 数据库对话助手
该工作流构建了一款智能对话助手,结合自然语言处理与数据库管理,让用户无需掌握 SQL 技能即可通过自然语言查询与分析数据。它能够动态生成 SQL 查询、获取数据库表结构、处理 JSON 数据,并提供清晰易懂的查询结果反馈。此工具极大降低了数据库操作的门槛,适用于企业内部数据分析、客户服务、产品支持以及教育培训等场景,提升了数据查询的便利性和效率。
Spot Workplace Discrimination Patterns with AI
该工作流通过自动化抓取和分析Glassdoor上的员工评价数据,利用AI技术深入解析公司评分及不同人口群体的职场体验差异,计算统计学指标并生成可视化图表。它帮助HR和管理层量化职场歧视现象,支持公平改进措施,推动组织文化改善和包容性评估,实现数据驱动的多元化、公平与包容项目的有效实施。
JSON文件邮件自动转存为表格
该工作流实现了通过Gmail自动获取最新邮件中的JSON文件,并将其转换为CSV格式的电子表格。它能够高效提取邮件中的二进制JSON数据,自动化处理邮件附件,避免手动下载和整理,显著提升数据处理效率,减少人工错误。适合企业和数据分析师在日常工作中快速归档和分析邮件数据,助力数据驱动决策。
Sync Youtube Video Urls with Google Sheets
该工作流实现了将YouTube频道的视频链接自动同步至Google Sheets,为内容创作者和数据分析师提供高效便捷的管理方案。用户可以通过指定的表格输入频道ID,系统会调用YouTube API获取最新的视频数据,并将其格式化后写入另一张表格,支持新增和更新操作,确保数据的实时性和准确性,极大简化了手动收集和整理视频链接的繁琐流程。
Shopify客户数据同步与导出自动化
该工作流实现了Shopify客户数据的自动化同步与导出,能够有效解决API分页限制问题。通过定时或手动触发,从Shopify提取并合并所有客户信息,实时更新至Google Sheets,便于管理和备份。同时,自动生成符合Squarespace导入要求的CSV文件,极大减少了手动处理的时间,提高了多平台数据管理的效率。