Extract text from PDF and image using Vertex AI (Gemini) into CSV

该工作流自动从Google Drive指定文件夹中新上传的PDF文件和图片中提取文本内容,使用Google Vertex AI(Gemini)和Openrouter的AI模型进行智能分析,最终将结构化数据转换为CSV格式并上传回Google Drive。它支持多种文件格式,提升文本识别准确率,完全实现数据处理的自动化,适用于财务、运营等领域,显著提高工作效率与数据准确性。

流程图
Extract text from PDF and image using Vertex AI (Gemini) into CSV 工作流程图

工作流名称

Extract text from PDF and image using Vertex AI (Gemini) into CSV

主要功能和亮点

本工作流实现了自动从Google Drive指定文件夹中新上传的PDF文件或图片中提取文本内容,并利用Google Vertex AI(Gemini)及Openrouter的AI模型进行智能识别和分析,最终将提取出的结构化数据转换成CSV格式文件上传回Google Drive,完全免除手动录入的繁琐。

  • 支持PDF和图片两种格式的文本识别
  • 集成先进的Google Gemini AI模型和Openrouter接口,提升识别准确率
  • 自动分类交易记录,生成带有类别字段的CSV文件
  • 全流程自动化,实时监控指定Google Drive文件夹

解决的核心问题

传统的PDF或图片中的数据提取往往需要人工操作,效率低且易出错。此工作流通过AI技术自动识别并结构化数据,解决了文档数据录入的低效和不准确问题,提升数据处理的自动化和智能化水平。

应用场景

  • 财务部门自动提取银行对账单、发票等PDF或图片中的交易数据
  • 运营团队快速从图片截图中获取关键信息
  • 任何需要从非结构化文档转换为结构化数据并存储的场景
  • 企业内部自动化数据处理与归档

主要流程步骤

  1. 监控Google Drive指定文件夹,检测新上传的PDF或图片文件
  2. 根据文件类型分类处理:PDF文件进入PDF下载与文本提取流程,图片文件进入图片下载与Vertex AI文本识别流程
  3. 利用内置的PDF提取节点或Vertex AI以及Openrouter的AI服务解析文件内容,提取交易数据
  4. 将提取的文本数据发送给AI模型,智能生成含分类的CSV数据
  5. 转换数据为CSV格式文件
  6. 自动上传生成的CSV文件回Google Drive指定文件夹

涉及的系统或服务

  • Google Drive:文件存储与触发器
  • Google Vertex AI(Gemini):图片文本识别与智能解析
  • Openrouter API:PDF文本智能分析
  • n8n自动化平台:流程调度和节点编排

适用人群或使用价值

适合财务人员、数据分析师、运营管理者及任何需要提升文档数据处理效率的专业人士。该工作流极大减少人工录入时间,提高数据准确度,助力企业实现智能化办公和数字化转型。