SHEETS RAG

该工作流旨在实现 Google Sheets 与 PostgreSQL 数据库之间的自动数据同步,支持智能识别表结构和字段类型,避免手动建表和数据清洗的繁琐。通过实时监控文件变更,自动触发数据更新,同时结合大型语言模型,用户可以通过自然语言轻松生成并执行 SQL 查询,降低了数据库操作的复杂性,提升了数据处理效率,适用于多种业务场景。

流程图
SHEETS RAG 工作流程图

工作流名称

SHEETS RAG

主要功能和亮点

该工作流实现了从 Google Sheets 自动同步数据到 PostgreSQL 数据库的完整流程,支持智能识别表结构、字段类型(包括日期格式和多种货币符号)、自动建表及数据插入。结合强大的大型语言模型(Google Gemini)和自定义 SQL 查询执行工具,能够基于自然语言问题智能生成并执行高效的 PostgreSQL 查询,提供动态交互式的数据查询体验。

解决的核心问题

  • 自动将 Google Sheets 中多样化的数据结构和格式(文本、日期、货币等)映射到数据库表中,避免手工建表和数据清洗的繁琐。
  • 实时监测 Google Drive 指定文件的变更,实现数据同步的自动触发。
  • 利用 AI 助手自动理解用户的自然语言查询,根据数据库模式构建安全、准确的 SQL 语句并执行,降低了复杂数据库查询的门槛。
  • 动态管理数据库表结构,避免重复建表冲突,保证数据一致性。

应用场景

  • 企业或团队需要将业务数据从 Google Sheets 无缝迁移到 PostgreSQL 数据库,便于后续分析和报表生成。
  • 业务人员或数据分析师希望通过自然语言直接查询数据库,无需掌握 SQL 技能。
  • 需要定期监控和同步在线表格数据,搭建灵活的数据中台或自动化数据管道。
  • 任何涉及多币种金额和日期数据管理的场景,确保数据格式准确存储与处理。

主要流程步骤

  1. Google Drive 触发:监控指定的 Google Sheets 文件变更触发工作流。
  2. 参数设置:设定目标表格 URL 和工作表名称。
  3. 数据库检测:检查对应的 PostgreSQL 表是否存在。
  4. 数据拉取:从 Google Sheets 抓取表格数据。
  5. 表结构推断:通过自定义代码节点动态推断字段类型(文本、日期、货币等),生成建表 SQL。
  6. 表管理:若表已存在则先删除,随后创建新表。
  7. 数据插入:格式化清洗数据,构造插入 SQL 并批量写入 PostgreSQL。
  8. AI 查询支持:结合 Google Gemini 大语言模型和自定义工具,自动解析自然语言查询,调用数据库查询工具执行并返回结果。
  9. 结果输出:将查询结果格式化输出,支持进一步交互。

涉及的系统或服务

  • Google Drive Trigger:监控 Google Drive 文件变化。
  • Google Sheets:拉取在线表格数据。
  • PostgreSQL:数据库存储与查询执行。
  • Google Gemini Chat Model:自然语言理解与 SQL 构建的 AI 模型。
  • n8n Code节点:实现动态类型推断和 SQL 语句生成逻辑。
  • LangChain 集成:AI Agent 结合工具链完成查询分析与执行。

适用人群或使用价值

  • 数据工程师和自动化开发者:快速搭建从表格到数据库的自动化同步流水线。
  • 业务分析师和非技术用户:通过自然语言直接查询数据库,降低技术门槛。
  • 产品经理和运营团队:实时获取和分析多维度业务数据,支持决策。
  • 多币种财务管理和跨地域业务场景,对复杂数据格式有高适配需求。

该工作流通过智能化、自动化的数据同步和交互查询方案,大幅提升数据处理效率和用户体验,助力企业实现数据驱动运营。