Extract text from PDF and image using Vertex AI (Gemini) into CSV

该工作流能够自动从Google Drive指定文件夹中新上传的PDF文件和图片中提取文本,通过Google Vertex AI和Openrouter AI进行智能识别与分析。提取后的交易数据将被转化为带有分类信息的CSV文件,并自动上传回Google Drive,从而简化了手动数据录入和分类的过程,提升了数据处理的效率和准确性,适用于财务管理和数据分析等多种场景。

流程图
Extract text from PDF and image using Vertex AI (Gemini) into CSV 工作流程图

工作流名称

Extract text from PDF and image using Vertex AI (Gemini) into CSV

主要功能和亮点

该工作流自动从Google Drive指定文件夹中新上传的PDF文件或图片中提取文本数据,利用Google Vertex AI(Gemini模型)和Openrouter AI的语言模型对内容进行智能识别和分析,最终将结构化的交易数据转换成带有分类信息的CSV文件,并自动上传回Google Drive,极大地简化了手动数据录入和分类的流程。

解决的核心问题

  • 自动识别并提取PDF及图片中的文字信息,避免人工逐条录入导致的低效和错误
  • 利用AI自动为交易数据添加类别标签,实现智能分类
  • 实现从文件上传到数据输出的全自动化流程,提高数据处理效率和准确性

应用场景

  • 财务账单、银行流水、发票等PDF文档的自动数据整理
  • 各类图片格式的支付凭证、交易截图等文字内容提取
  • 需要将非结构化财务数据转化为结构化CSV文件以便后续分析和存档的场景
  • 企业或个人财务自动化管理和报表生成

主要流程步骤

  1. 监听Google Drive指定文件夹中的新文件上传事件(PDF或图片)
  2. 根据文件类型分流,分别下载对应文件
  3. 对PDF文件调用内置提取节点获取文本内容
  4. 对图片文件发送给Google Vertex AI进行图像文字识别
  5. 将提取的文本数据发送至Openrouter AI语言模型,智能解析交易信息并生成带分类的CSV格式数据
  6. 将生成的CSV文件转换为实际文件格式
  7. 自动上传生成的CSV文件回Google Drive指定文件夹,完成数据归档

涉及的系统或服务

  • Google Drive(文件上传触发、文件下载与上传)
  • Google Vertex AI(图像文字识别,Gemini-1.5-pro模型)
  • Openrouter AI(自然语言处理,基于Meta LLaMA 3.1模型)
  • n8n自动化平台(流程编排与节点执行)

适用人群或使用价值

  • 财务人员和会计,帮助快速整理账单和交易记录
  • 企业自动化运营团队,提升数据处理效率
  • 数据分析师,获得标准化且分类清晰的交易数据,方便后续分析
  • 任何需要将PDF和图片中的非结构化文字数据转为结构化电子表格的用户
  • 希望减少手工录入、提高数据准确性和工作效率的个人或团队

综上,该工作流通过结合Google云AI和先进语言模型,实现了从文件上传到智能数据提取、分类、整理和存储的全自动化闭环,极大地解放了人工劳动,提高了数据处理速度和准确性,是财务数据数字化转型的有力工具。