Extract text from PDF and image using Vertex AI (Gemini) into CSV
该工作流能够自动从Google Drive指定文件夹中新上传的PDF文件和图片中提取文本,通过Google Vertex AI和Openrouter AI进行智能识别与分析。提取后的交易数据将被转化为带有分类信息的CSV文件,并自动上传回Google Drive,从而简化了手动数据录入和分类的过程,提升了数据处理的效率和准确性,适用于财务管理和数据分析等多种场景。
流程图

工作流名称
Extract text from PDF and image using Vertex AI (Gemini) into CSV
主要功能和亮点
该工作流自动从Google Drive指定文件夹中新上传的PDF文件或图片中提取文本数据,利用Google Vertex AI(Gemini模型)和Openrouter AI的语言模型对内容进行智能识别和分析,最终将结构化的交易数据转换成带有分类信息的CSV文件,并自动上传回Google Drive,极大地简化了手动数据录入和分类的流程。
解决的核心问题
- 自动识别并提取PDF及图片中的文字信息,避免人工逐条录入导致的低效和错误
- 利用AI自动为交易数据添加类别标签,实现智能分类
- 实现从文件上传到数据输出的全自动化流程,提高数据处理效率和准确性
应用场景
- 财务账单、银行流水、发票等PDF文档的自动数据整理
- 各类图片格式的支付凭证、交易截图等文字内容提取
- 需要将非结构化财务数据转化为结构化CSV文件以便后续分析和存档的场景
- 企业或个人财务自动化管理和报表生成
主要流程步骤
- 监听Google Drive指定文件夹中的新文件上传事件(PDF或图片)
- 根据文件类型分流,分别下载对应文件
- 对PDF文件调用内置提取节点获取文本内容
- 对图片文件发送给Google Vertex AI进行图像文字识别
- 将提取的文本数据发送至Openrouter AI语言模型,智能解析交易信息并生成带分类的CSV格式数据
- 将生成的CSV文件转换为实际文件格式
- 自动上传生成的CSV文件回Google Drive指定文件夹,完成数据归档
涉及的系统或服务
- Google Drive(文件上传触发、文件下载与上传)
- Google Vertex AI(图像文字识别,Gemini-1.5-pro模型)
- Openrouter AI(自然语言处理,基于Meta LLaMA 3.1模型)
- n8n自动化平台(流程编排与节点执行)
适用人群或使用价值
- 财务人员和会计,帮助快速整理账单和交易记录
- 企业自动化运营团队,提升数据处理效率
- 数据分析师,获得标准化且分类清晰的交易数据,方便后续分析
- 任何需要将PDF和图片中的非结构化文字数据转为结构化电子表格的用户
- 希望减少手工录入、提高数据准确性和工作效率的个人或团队
综上,该工作流通过结合Google云AI和先进语言模型,实现了从文件上传到智能数据提取、分类、整理和存储的全自动化闭环,极大地解放了人工劳动,提高了数据处理速度和准确性,是财务数据数字化转型的有力工具。