Extract text from PDF and image using Vertex AI (Gemini) into CSV

该工作流能够自动从Google Drive指定文件夹中新上传的PDF文件和图片中提取文本，通过Google Vertex AI和Openrouter AI进行智能识别与分析。提取后的交易数据将被转化为带有分类信息的CSV文件，并自动上传回Google Drive，从而简化了手动数据录入和分类的过程，提升了数据处理的效率和准确性，适用于财务管理和数据分析等多种场景。

文本提取智能分类

工作流名称

主要功能和亮点

该工作流自动从Google Drive指定文件夹中新上传的PDF文件或图片中提取文本数据，利用Google Vertex AI（Gemini模型）和Openrouter AI的语言模型对内容进行智能识别和分析，最终将结构化的交易数据转换成带有分类信息的CSV文件，并自动上传回Google Drive，极大地简化了手动数据录入和分类的流程。

解决的核心问题

自动识别并提取PDF及图片中的文字信息，避免人工逐条录入导致的低效和错误
利用AI自动为交易数据添加类别标签，实现智能分类
实现从文件上传到数据输出的全自动化流程，提高数据处理效率和准确性

应用场景

财务账单、银行流水、发票等PDF文档的自动数据整理
各类图片格式的支付凭证、交易截图等文字内容提取
需要将非结构化财务数据转化为结构化CSV文件以便后续分析和存档的场景
企业或个人财务自动化管理和报表生成

主要流程步骤

监听Google Drive指定文件夹中的新文件上传事件（PDF或图片）
根据文件类型分流，分别下载对应文件
对PDF文件调用内置提取节点获取文本内容
对图片文件发送给Google Vertex AI进行图像文字识别
将提取的文本数据发送至Openrouter AI语言模型，智能解析交易信息并生成带分类的CSV格式数据
将生成的CSV文件转换为实际文件格式
自动上传生成的CSV文件回Google Drive指定文件夹，完成数据归档

涉及的系统或服务

Google Drive（文件上传触发、文件下载与上传）
Google Vertex AI（图像文字识别，Gemini-1.5-pro模型）
Openrouter AI（自然语言处理，基于Meta LLaMA 3.1模型）
n8n自动化平台（流程编排与节点执行）

适用人群或使用价值

财务人员和会计，帮助快速整理账单和交易记录
企业自动化运营团队，提升数据处理效率
数据分析师，获得标准化且分类清晰的交易数据，方便后续分析
任何需要将PDF和图片中的非结构化文字数据转为结构化电子表格的用户
希望减少手工录入、提高数据准确性和工作效率的个人或团队

综上，该工作流通过结合Google云AI和先进语言模型，实现了从文件上传到智能数据提取、分类、整理和存储的全自动化闭环，极大地解放了人工劳动，提高了数据处理速度和准确性，是财务数据数字化转型的有力工具。

Calculate the Centroid of a Set of Vectors（向量集合质心计算）

该工作流能够自动接收并处理多个向量，确保输入数据的维度一致性，计算出这些向量的质心，即各维度的平均值，并将结果以友好的格式返回。它有效解决了多维数据处理中的常见问题，适用于数据分析、机器学习及地理信息系统等领域，提升了数据处理的自动化和准确性。

质心计算向量处理

AI Agent 与 Supabase/PostgreSQL 数据库对话助手

该工作流构建了一款智能对话助手，结合自然语言处理与数据库管理，让用户无需掌握 SQL 技能即可通过自然语言查询与分析数据。它能够动态生成 SQL 查询、获取数据库表结构、处理 JSON 数据，并提供清晰易懂的查询结果反馈。此工具极大降低了数据库操作的门槛，适用于企业内部数据分析、客户服务、产品支持以及教育培训等场景，提升了数据查询的便利性和效率。

自然语言查询数据库助手

Spot Workplace Discrimination Patterns with AI

该工作流通过自动化抓取和分析Glassdoor上的员工评价数据，利用AI技术深入解析公司评分及不同人口群体的职场体验差异，计算统计学指标并生成可视化图表。它帮助HR和管理层量化职场歧视现象，支持公平改进措施，推动组织文化改善和包容性评估，实现数据驱动的多元化、公平与包容项目的有效实施。

职场歧视分析数据可视化

JSON文件邮件自动转存为表格

该工作流实现了通过Gmail自动获取最新邮件中的JSON文件，并将其转换为CSV格式的电子表格。它能够高效提取邮件中的二进制JSON数据，自动化处理邮件附件，避免手动下载和整理，显著提升数据处理效率，减少人工错误。适合企业和数据分析师在日常工作中快速归档和分析邮件数据，助力数据驱动决策。

邮件自动化JSON转表格

Sync Youtube Video Urls with Google Sheets

该工作流实现了将YouTube频道的视频链接自动同步至Google Sheets，为内容创作者和数据分析师提供高效便捷的管理方案。用户可以通过指定的表格输入频道ID，系统会调用YouTube API获取最新的视频数据，并将其格式化后写入另一张表格，支持新增和更新操作，确保数据的实时性和准确性，极大简化了手动收集和整理视频链接的繁琐流程。

YouTube同步Google Sheets

Shopify客户数据同步与导出自动化

该工作流实现了Shopify客户数据的自动化同步与导出，能够有效解决API分页限制问题。通过定时或手动触发，从Shopify提取并合并所有客户信息，实时更新至Google Sheets，便于管理和备份。同时，自动生成符合Squarespace导入要求的CSV文件，极大减少了手动处理的时间，提高了多平台数据管理的效率。

Shopify同步客户数据管理

Google Sheets 新数据实时通知

该工作流能够每隔45分钟自动检查指定的Google Sheets表格，实时检测新增数据。一旦发现新条目，系统会通过Mattermost即时发送通知，包含新增数据的ID、姓名和邮箱。这一流程显著提升了数据监控的效率，解决了数据人员手动检查表格的繁琐问题，适用于需要快速响应客户信息更新的团队，如销售和客服。

Google Sheets通知实时监控

Google Trend Data Extract, Summarization with Bright Data & Google Gemini

该工作流实现了从Google趋势网站自动抓取数据，并通过Bright Data的Web Unlocker进行结构化提取。结合Google Gemini语言模型，完成信息抽取与内容总结，生成趋势数据和摘要报告。支持结果实时推送和邮件发送，确保用户方便获取市场动态，提升数据分析与决策效率，适用于市场调研、内容创作及业务智能等多个领域。

Google趋势数据采集