Extract text from PDF and image using Vertex AI (Gemini) into CSV
该工作流能够自动从Google Drive指定文件夹中新上传的PDF文件和图片中提取文本,通过Google Vertex AI和Openrouter AI进行智能识别与分析。提取后的交易数据将被转化为带有分类信息的CSV文件,并自动上传回Google Drive,从而简化了手动数据录入和分类的过程,提升了数据处理的效率和准确性,适用于财务管理和数据分析等多种场景。
Tags
工作流名称
Extract text from PDF and image using Vertex AI (Gemini) into CSV
主要功能和亮点
该工作流自动从Google Drive指定文件夹中新上传的PDF文件或图片中提取文本数据,利用Google Vertex AI(Gemini模型)和Openrouter AI的语言模型对内容进行智能识别和分析,最终将结构化的交易数据转换成带有分类信息的CSV文件,并自动上传回Google Drive,极大地简化了手动数据录入和分类的流程。
解决的核心问题
- 自动识别并提取PDF及图片中的文字信息,避免人工逐条录入导致的低效和错误
- 利用AI自动为交易数据添加类别标签,实现智能分类
- 实现从文件上传到数据输出的全自动化流程,提高数据处理效率和准确性
应用场景
- 财务账单、银行流水、发票等PDF文档的自动数据整理
- 各类图片格式的支付凭证、交易截图等文字内容提取
- 需要将非结构化财务数据转化为结构化CSV文件以便后续分析和存档的场景
- 企业或个人财务自动化管理和报表生成
主要流程步骤
- 监听Google Drive指定文件夹中的新文件上传事件(PDF或图片)
- 根据文件类型分流,分别下载对应文件
- 对PDF文件调用内置提取节点获取文本内容
- 对图片文件发送给Google Vertex AI进行图像文字识别
- 将提取的文本数据发送至Openrouter AI语言模型,智能解析交易信息并生成带分类的CSV格式数据
- 将生成的CSV文件转换为实际文件格式
- 自动上传生成的CSV文件回Google Drive指定文件夹,完成数据归档
涉及的系统或服务
- Google Drive(文件上传触发、文件下载与上传)
- Google Vertex AI(图像文字识别,Gemini-1.5-pro模型)
- Openrouter AI(自然语言处理,基于Meta LLaMA 3.1模型)
- n8n自动化平台(流程编排与节点执行)
适用人群或使用价值
- 财务人员和会计,帮助快速整理账单和交易记录
- 企业自动化运营团队,提升数据处理效率
- 数据分析师,获得标准化且分类清晰的交易数据,方便后续分析
- 任何需要将PDF和图片中的非结构化文字数据转为结构化电子表格的用户
- 希望减少手工录入、提高数据准确性和工作效率的个人或团队
综上,该工作流通过结合Google云AI和先进语言模型,实现了从文件上传到智能数据提取、分类、整理和存储的全自动化闭环,极大地解放了人工劳动,提高了数据处理速度和准确性,是财务数据数字化转型的有力工具。
Calculate the Centroid of a Set of Vectors(向量集合质心计算)
该工作流能够自动接收并处理多个向量,确保输入数据的维度一致性,计算出这些向量的质心,即各维度的平均值,并将结果以友好的格式返回。它有效解决了多维数据处理中的常见问题,适用于数据分析、机器学习及地理信息系统等领域,提升了数据处理的自动化和准确性。
AI Agent 与 Supabase/PostgreSQL 数据库对话助手
该工作流构建了一款智能对话助手,结合自然语言处理与数据库管理,让用户无需掌握 SQL 技能即可通过自然语言查询与分析数据。它能够动态生成 SQL 查询、获取数据库表结构、处理 JSON 数据,并提供清晰易懂的查询结果反馈。此工具极大降低了数据库操作的门槛,适用于企业内部数据分析、客户服务、产品支持以及教育培训等场景,提升了数据查询的便利性和效率。
Spot Workplace Discrimination Patterns with AI
该工作流通过自动化抓取和分析Glassdoor上的员工评价数据,利用AI技术深入解析公司评分及不同人口群体的职场体验差异,计算统计学指标并生成可视化图表。它帮助HR和管理层量化职场歧视现象,支持公平改进措施,推动组织文化改善和包容性评估,实现数据驱动的多元化、公平与包容项目的有效实施。
JSON文件邮件自动转存为表格
该工作流实现了通过Gmail自动获取最新邮件中的JSON文件,并将其转换为CSV格式的电子表格。它能够高效提取邮件中的二进制JSON数据,自动化处理邮件附件,避免手动下载和整理,显著提升数据处理效率,减少人工错误。适合企业和数据分析师在日常工作中快速归档和分析邮件数据,助力数据驱动决策。
Sync Youtube Video Urls with Google Sheets
该工作流实现了将YouTube频道的视频链接自动同步至Google Sheets,为内容创作者和数据分析师提供高效便捷的管理方案。用户可以通过指定的表格输入频道ID,系统会调用YouTube API获取最新的视频数据,并将其格式化后写入另一张表格,支持新增和更新操作,确保数据的实时性和准确性,极大简化了手动收集和整理视频链接的繁琐流程。
Shopify客户数据同步与导出自动化
该工作流实现了Shopify客户数据的自动化同步与导出,能够有效解决API分页限制问题。通过定时或手动触发,从Shopify提取并合并所有客户信息,实时更新至Google Sheets,便于管理和备份。同时,自动生成符合Squarespace导入要求的CSV文件,极大减少了手动处理的时间,提高了多平台数据管理的效率。
Google Sheets 新数据实时通知
该工作流能够每隔45分钟自动检查指定的Google Sheets表格,实时检测新增数据。一旦发现新条目,系统会通过Mattermost即时发送通知,包含新增数据的ID、姓名和邮箱。这一流程显著提升了数据监控的效率,解决了数据人员手动检查表格的繁琐问题,适用于需要快速响应客户信息更新的团队,如销售和客服。
Google Trend Data Extract, Summarization with Bright Data & Google Gemini
该工作流实现了从Google趋势网站自动抓取数据,并通过Bright Data的Web Unlocker进行结构化提取。结合Google Gemini语言模型,完成信息抽取与内容总结,生成趋势数据和摘要报告。支持结果实时推送和邮件发送,确保用户方便获取市场动态,提升数据分析与决策效率,适用于市场调研、内容创作及业务智能等多个领域。