Extract text from PDF and image using Vertex AI (Gemini) into CSV
该工作流自动从Google Drive指定文件夹中新上传的PDF文件和图片中提取文本内容,使用Google Vertex AI(Gemini)和Openrouter的AI模型进行智能分析,最终将结构化数据转换为CSV格式并上传回Google Drive。它支持多种文件格式,提升文本识别准确率,完全实现数据处理的自动化,适用于财务、运营等领域,显著提高工作效率与数据准确性。
流程图

工作流名称
Extract text from PDF and image using Vertex AI (Gemini) into CSV
主要功能和亮点
本工作流实现了自动从Google Drive指定文件夹中新上传的PDF文件或图片中提取文本内容,并利用Google Vertex AI(Gemini)及Openrouter的AI模型进行智能识别和分析,最终将提取出的结构化数据转换成CSV格式文件上传回Google Drive,完全免除手动录入的繁琐。
- 支持PDF和图片两种格式的文本识别
- 集成先进的Google Gemini AI模型和Openrouter接口,提升识别准确率
- 自动分类交易记录,生成带有类别字段的CSV文件
- 全流程自动化,实时监控指定Google Drive文件夹
解决的核心问题
传统的PDF或图片中的数据提取往往需要人工操作,效率低且易出错。此工作流通过AI技术自动识别并结构化数据,解决了文档数据录入的低效和不准确问题,提升数据处理的自动化和智能化水平。
应用场景
- 财务部门自动提取银行对账单、发票等PDF或图片中的交易数据
- 运营团队快速从图片截图中获取关键信息
- 任何需要从非结构化文档转换为结构化数据并存储的场景
- 企业内部自动化数据处理与归档
主要流程步骤
- 监控Google Drive指定文件夹,检测新上传的PDF或图片文件
- 根据文件类型分类处理:PDF文件进入PDF下载与文本提取流程,图片文件进入图片下载与Vertex AI文本识别流程
- 利用内置的PDF提取节点或Vertex AI以及Openrouter的AI服务解析文件内容,提取交易数据
- 将提取的文本数据发送给AI模型,智能生成含分类的CSV数据
- 转换数据为CSV格式文件
- 自动上传生成的CSV文件回Google Drive指定文件夹
涉及的系统或服务
- Google Drive:文件存储与触发器
- Google Vertex AI(Gemini):图片文本识别与智能解析
- Openrouter API:PDF文本智能分析
- n8n自动化平台:流程调度和节点编排
适用人群或使用价值
适合财务人员、数据分析师、运营管理者及任何需要提升文档数据处理效率的专业人士。该工作流极大减少人工录入时间,提高数据准确度,助力企业实现智能化办公和数字化转型。