Google Drive 文件重复项自动管理工作流
该工作流旨在自动管理Google Drive中的重复文件,通过定期监控指定文件夹,自动检测并处理重复项。用户可以选择保留最新或最早上传的文件,并决定如何处理重复文件(移入垃圾箱或重命名)。同时,系统会自动排除Google Apps格式文件,确保高效清理真实的二进制文件,减少存储空间浪费,降低误删风险,提升文件管理的便捷性。
流程图

工作流名称
Google Drive 文件重复项自动管理工作流
主要功能和亮点
该工作流自动检测Google Drive指定文件夹内的重复文件,并根据用户配置自动处理这些重复项。支持两种保留策略(保留最早上传文件或保留最新上传文件),以及两种重复文件处理方式(直接移入垃圾箱或标记重命名为“DUPLICATE-”前缀)。同时,工作流会自动排除Google Apps格式的文件(如Docs、Sheets等),确保只处理真实的二进制文件。
解决的核心问题
该工作流帮助用户高效管理Google Drive中的重复文件,避免手动查找和删除重复文件的繁琐过程,减少存储空间浪费,降低误删风险。支持自动标记重复文件,方便后续人工复核,或直接将重复文件移动至垃圾箱,实现文件清理自动化。
应用场景
- 个人或企业用户需要定期清理Google Drive中的重复文件,确保文件夹整洁。
- 团队共享盘中频繁上传、修改文件导致的重复文件管理。
- 需要自动化文件去重流程,减少人工维护工作量。
- 既希望保留最新版本文件,又希望对重复文件进行标识或删除的场景。
主要流程步骤
- 触发器(Google Drive Trigger):定时(默认每15分钟)监控指定Google Drive文件夹中新上传的文件。
- 配置参数(Config):设定保留策略(first/last)、重复文件操作(flag/trash)以及目标文件夹和文件所有者。
- 获取工作文件夹中的文件(Working Folder):过滤指定文件夹且文件所有者匹配的文件列表。
- 过滤Google Apps文件(Drop Google Apps files):排除Google Docs、Sheets等非二进制文件。
- 选择保留策略(Keep First/Last):根据配置,选择按创建时间先后排序以确定保留的文件。
- 检测重复文件(Deduplicate Keep First / Deduplicate Keep Last):通过MD5校验文件内容,标记重复文件。
- 编辑字段(Edit Fields):整理文件相关字段,方便后续判断。
- 过滤重复文件(Filter):筛选出被标记为重复的文件。
- 决定处理方式(Trash/Flag Duplicates):根据配置,选择是将重复文件移入垃圾箱,还是标记重命名。
- 执行操作:
- 发送到垃圾箱(Send Duplicates to Trash):将重复文件移动到Google Drive垃圾箱,支持30天内恢复。
- 标记为重复(Google Drive 节点):给重复文件名前加上“DUPLICATE-”前缀,便于识别。
- 跳过已标记文件(Is Flagged):避免重复标记已经带有“DUPLICATE-”前缀的文件。
涉及的系统或服务
- Google Drive:文件存储、文件信息获取、文件删除及重命名操作。
- n8n自动化平台:工作流设计与执行。
适用人群或使用价值
- 个人用户:需要自动整理个人Google Drive中的重复文件,释放存储空间。
- 企业及团队:管理共享盘文件,避免因文件重复导致的混乱与存储浪费。
- IT管理员及自动化工程师:通过该工作流实现文件重复检测与处理的自动化,提高运营效率。
- 任何希望简化Google Drive文件去重流程的用户或团队。
该工作流通过灵活配置和自动执行,极大提升Google Drive文件管理的智能化和便捷性,让用户专注于更重要的工作内容。