Gmail to Vector Embeddings with PGVector and Ollama

该工作流自动从Gmail邮箱抓取邮件,结构化存储邮件内容到PostgreSQL数据库,并利用Ollama模型将文本转换为向量嵌入,存入PGVector数据库。支持历史邮件批量导入和新邮件实时监听,自动处理附件,提升邮件数据整理与智能检索的效率,适用于需要快速定位和分析大量邮件信息的企业与个人。

Tags

邮件向量化智能检索

工作流名称

Gmail to Vector Embeddings with PGVector and Ollama

主要功能和亮点

该工作流实现了自动从Gmail邮箱抓取邮件,并将邮件内容结构化存储到PostgreSQL数据库中,同时利用Ollama的nomic-embed-text模型将邮件文本转化为向量嵌入(Vector Embeddings),存储于PGVector向量数据库,支持基于内容的相似度搜索。它支持批量导入历史邮件及实时监听新邮件,自动处理附件,并能按时间分批次抓取邮件。

解决的核心问题

  • 自动化整理和存储海量邮件数据,避免手动管理带来的低效和混乱
  • 将非结构化邮件文本转化为结构化数据及向量表示,方便后续的快速检索和智能分析
  • 支持邮件内容的相似度搜索,提升邮件信息利用效率
  • 解决历史邮件批量导入与新邮件实时同步的统一管理问题

应用场景

  • 企业或个人对大量邮件进行归档、检索和分析
  • 需要基于邮件内容做知识库构建、智能搜索和数据挖掘的场景
  • 客户服务、销售跟踪中快速定位相关邮件内容
  • 邮件数据与AI应用(如聊天机器人、智能问答)结合的基础数据准备

主要流程步骤

  1. Gmail Trigger:定时(每分钟)监听Gmail收件箱的新邮件,支持附件下载
  2. 批量历史邮件获取:通过设置时间区间,批量拉取历史邮件数据
  3. 邮件字段提取:抽取邮件文本、发件人、收件人、抄送、主题、附件等关键信息
  4. 结构化存储:将提取的邮件元数据保存到PostgreSQL数据库的emails_metadata
  5. 文本分割:对邮件正文进行递归字符切割,保证向量化输入质量
  6. 向量嵌入生成:调用Ollama的nomic-embed-text模型,生成邮件文本的向量表示
  7. 向量存储:将生成的向量嵌入存入PGVector的emails_embeddings表,关联邮件ID和线程ID
  8. 条件判断:针对手动触发和自动触发流程进行分流处理,确保灵活运行

涉及的系统或服务

  • Gmail(邮件收集和触发)
  • PostgreSQL(结构化数据存储)
  • PGVector(向量数据库插件,存储向量嵌入)
  • Ollama(调用nomic-embed-text模型生成文本嵌入)
  • n8n自动化平台(工作流编排执行)

适用人群或使用价值

  • IT运维和数据工程师:自动化邮件数据归档与管理,提升系统数据资产价值
  • 数据科学家和AI开发者:快速获取结构化邮件数据和对应向量,为机器学习和智能应用提供基础
  • 企业管理者和办公人员:提升邮件检索效率,优化客户沟通和内部信息管理
  • 任何需要对大量邮件内容做智能分析、搜索和归档的用户

该工作流将邮件数据处理与先进的向量化技术结合,实现邮件内容的结构化存储与智能检索,极大提升邮件管理的智能化与自动化水平。通过灵活的时间区间批量导入和实时监听新邮件,满足多场景下邮件数据的高效利用需求。

推荐模板

Email Summary Agent

这个工作流每天早上7点自动抓取过去24小时内指定邮箱的所有邮件,利用GPT-4o-mini模型进行智能摘要和关键信息提炼,最终生成美观的HTML格式邮件总结并发送到团队邮箱。它帮助团队高效处理大量邮件,快速了解重要内容与待办事项,避免信息遗漏,提升沟通效率,特别适合需要定期整理邮件信息的企业团队。

邮件摘要自动化汇总

Gmail促销邮件转播客自动化工作流

此工作流自动监控Gmail中的促销邮件,提取并智能摘要邮件内容后,生成语音文件,并通过Telegram发送给指定聊天群。用户无需阅读繁杂的邮件,可随时收听促销信息,极大地提升信息获取效率和便利性,特别适合忙碌的职场人士、视力障碍者及喜欢音频内容的用户。

邮件转语音自动化推送

手动触发发送测试邮件工作流

该工作流通过手动触发,快速自动发送一封预设内容的测试邮件,简化了邮件发送功能的测试过程。用户只需点击执行,即可验证邮件服务的连接性和SMTP配置的正确性,适合开发者和测试人员在开发阶段进行调试。此外,该工作流也可用于向指定邮箱发送提醒或通知,提升邮件服务的调试效率,确保邮件通知系统的稳定性。

邮件测试手动触发

Email verification with Icypeas (single)

该工作流主要通过集成Icypeas邮箱验证服务,实现对单个邮箱地址的实时验证。用户只需输入API凭证,即可自动完成身份认证和邮箱有效性检测,确保验证过程的安全与高效。此解决方案简化了复杂的邮箱验证流程,帮助企业减少无效邮箱带来的沟通障碍和资源浪费,提升数据质量,适用于电商、市场营销及客户管理等多个场景。

邮箱验证Icypeas集成

Hacker News Show HN 热门趋势邮件推送

该工作流能够定时抓取 Hacker News 首页内容,自动筛选出包含“Show HN:”关键词的热门项目,并通过邮件推送给用户。它解决了用户手动查找信息的繁琐过程,实现了数据的自动化采集和整合,帮助技术爱好者、创业者及投资人快速获取最新的创意和项目展示,提升了信息获取的效率和准确性。

Hacker News邮件推送

WordPress Contact Form (CF7) Responses and Classification

该工作流通过自动接收WordPress网站Contact Form 7插件的用户提交信息,智能分类客户留言,并利用Google Gemini语言模型生成个性化的回复邮件草稿。所有数据统一存储到Google Sheets,实现客户咨询的全流程自动化管理。该系统显著提升了客服响应速度和质量,帮助企业更高效地处理客户需求,优化服务流程,适合中小企业和电商平台使用。

智能客服自动分类

Forward Netflix emails to multiple email addresses with GMail and Mailjet

该工作流能够自动监控Gmail邮箱中来自Netflix的邮件,并将其内容实时批量转发至多个预设收件人。用户可自定义收件人列表,确保重要通知和账单信息及时传达,避免手动转发的繁琐与遗漏。适合家庭成员共享Netflix相关信息或团队内部同步邮件,显著提升沟通效率与管理便捷性,是希望简化邮件管理和增强信息传递的用户的理想选择。

邮件转发自动化办公

Email mailbox as Todoist tasks

该工作流将Gmail邮箱中的未读及星标邮件自动转化为Todoist任务,借助AI智能分析邮件内容,生成任务标题、描述和建议处理方案。它有效解决了邮件管理混乱和任务遗漏的问题,帮助用户高效捕捉工作重点,提高邮件处理与任务管理的效率,适合需要快速将邮件转化为可执行任务的职场人士和团队。

邮件转任务AI自动化