RAG & GenAI App With WordPress Content

该工作流通过自动化抓取WordPress网站的文章和页面内容,实现基于检索增强生成式人工智能的智能问答系统。它对内容进行过滤、转换和向量化处理,并将数据存储在Supabase数据库中,支持高效的语义检索和动态问答。结合OpenAI的GPT-4模型,用户可以享受更精准的查询体验,同时实现了聊天记忆的持久化管理,增强了交互的上下文连续性,提升了网站内容的智能化利用价值。

Tags

RAG应用智能问答

工作流名称

RAG & GenAI App With WordPress Content

主要功能和亮点

该工作流实现了基于WordPress网站内容的检索增强生成式人工智能(RAG)应用。它自动抓取WordPress的文章和页面内容,进行内容过滤、转换和向量化处理,然后将嵌入数据存储在Supabase向量数据库中,支持基于内容的智能问答。结合OpenAI GPT-4模型和Postgres持久化聊天记忆,实现了网站内容的动态更新与智能互动。

解决的核心问题

  • 自动化从WordPress网站同步最新内容,避免手动更新数据。
  • 通过向量嵌入技术,实现对大规模网站内容的高效语义检索。
  • 解决传统问答系统无法准确利用网站丰富内容的问题,提升用户查询体验。
  • 支持内容的发布状态和保护状态过滤,确保敏感内容不被暴露。
  • 实现聊天历史的持久化管理,增强用户交互的上下文连续性。

应用场景

  • 企业或个人网站通过智能问答机器人,提升用户访问体验和内容利用率。
  • 内容丰富的WordPress网站,如博客、资讯站点,构建基于内容的智能客服或助手。
  • 需要定期同步网站内容并构建知识库的场景。
  • 结合GenAI技术,实现智能内容推荐、问答和交互。

主要流程步骤

  1. 触发与内容获取
    • 手动触发或定时触发工作流。
    • 通过WordPress节点抓取所有文章和页面,支持基于上次执行时间的增量获取。
  2. 数据过滤与处理
    • 过滤仅保留已发布且未受保护的内容。
    • 将HTML内容转换为Markdown格式,便于后续处理。
  3. 内容拆分与嵌入生成
    • 使用Token Splitter将内容拆分为指定大小的片段,保证上下文连续性。
    • 利用OpenAI文本嵌入模型(text-embedding-3-small)生成内容向量。
  4. 向量数据存储与更新
    • 判断内容是否已存在于Supabase向量数据库。
    • 对已更新内容执行删除并重新插入操作,新增内容直接插入。
    • 记录工作流执行历史,便于增量更新控制。
  5. 智能问答交互
    • 监听聊天触发器,接收用户输入。
    • 根据用户输入,从Supabase检索相关文档。
    • 结合OpenAI GPT-4模型和Postgres聊天记忆,生成包含文档元信息的回答。
    • 通过Webhook节点响应用户请求,完成问答交互。

涉及的系统或服务

  • WordPress:获取网站文章和页面内容。
  • OpenAI:文本嵌入生成(text-embedding-3-small模型)和对话生成(gpt-4o-mini模型)。
  • Supabase:存储和管理向量数据及工作流执行历史。
  • Postgres:持久化存储聊天历史,支持向量检索。
  • n8n核心节点:手动触发、定时触发、HTTP请求、Webhook响应、数据处理(聚合、过滤、设置字段等)。

适用人群或使用价值

  • 网站运营者和内容管理者,期望通过自动化工具提升内容智能化利用。
  • 开发者和技术团队,快速搭建基于WordPress内容的智能问答系统。
  • 企业客户服务团队,打造集成网站内容的智能客服机器人。
  • 希望结合生成式AI和检索增强技术,提升用户交互质量和内容搜索体验的各类组织。

该工作流通过高度自动化和多系统集成,实现了WordPress内容到智能问答的闭环,极大提升了网站内容的智能化应用价值。

推荐模板

Slack AI Chatbot with RAG for company staff

该工作流构建了一个智能聊天机器人,集成于Slack平台,使用RAG技术实时连接企业内部知识库,帮助员工快速查询公司文件、政策和流程。机器人支持自然语言交互,能够精准提取相关信息并以友好的格式回复,确保信息准确可靠。此系统不仅提升了信息获取效率,还自动化了IT支持和人力资源相关问题的响应,极大地改善了员工的工作体验和沟通效率。

Slack机器人RAG问答

YouTube视频智能摘要与问答生成

这个工作流能够自动从指定的YouTube视频中提取转录文本,生成简明摘要,并智能地提供与视频内容相关的问答示例。通过集成先进的文本处理和自然语言生成技术,它大幅提升了信息获取的效率,适用于内容创作者、教育工作者和市场分析师等专业人士,帮助他们快速掌握视频主旨并进行知识管理和内容再利用。

视频摘要智能问答

欧盟可持续立法议程自动筛选与任务创建工作流

该工作流自动抓取欧盟议会官网最近18天的立法程序数据,利用先进的AI技术智能筛选与环境可持续性相关的议题。筛选结果将被存储到Google Sheets,并为每个相关议题生成Google任务提醒,帮助用户高效跟踪和管理立法动态。此流程显著提升了信息处理效率,确保用户能够及时关注关键的可持续发展政策。

可持续立法智能筛选

Perplexity Researcher

该工作流通过接收用户查询,自动生成符合AI模型要求的提示语,并调用相关API进行深度内容检索,提取并输出简洁、结构化的回答。它能够提供带有引用的权威资料,确保结果的专业性和可信度,帮助用户快速获取某一领域的最新研究材料,提升信息检索效率与内容质量,适用于学术研究、内容创作和行业分析等多个场景。

智能检索内容提取

Notion知识库智能助理(Notion Knowledge Base Assistant)

该工作流结合了先进的AI语言模型与Notion知识库,提供智能问答服务。用户可以通过输入问题,系统会自动检索相关内容并生成准确回答,同时附带Notion页面链接,确保信息的可靠性和可追溯性。该助手提升了知识查询的效率,适用于企业内部知识管理、客户支持和个人信息检索等多种场景,帮助用户快速获取所需信息。

知识库问答智能检索

OpenAI Personal Shopper with RAG and WooCommerce

该工作流通过集成语言模型和检索增强生成技术,为电商平台提供智能个人购物助手功能。它能够自动识别用户的购物需求,精准提取商品搜索信息,并在WooCommerce数据库中匹配相关商品。同时,针对非购物问题,系统基于知识库提供智能回答,提升用户体验。通过上下文管理,确保对话的连续性,显著提高客户满意度和服务效率。

智能购物助手RAG知识库

Agent Milvus tool

该工作流通过自动抓取Paul Graham网站的最新文章,提取并处理文本内容后,将其转化为向量存储在Milvus数据库中。结合OpenAI的嵌入模型,实现基于知识库的智能问答和信息检索。支持手动触发和聊天消息触发AI响应,适用于研究人员、企业和内容创作者,提升信息管理和检索效率,简化知识库构建流程。

向量检索智能问答

RAG Workflow For Company Documents stored in Google Drive

该工作流构建了一个智能问答系统,基于存储在Google Drive中的公司文档,利用向量数据库和大语言模型实现信息的快速检索与自然语言交互。通过自动同步文档更新,员工能够实时获取政策和流程相关的简洁准确答案,从而提升知识管理效率,优化自助服务体验,解决了传统文档分散和检索困难的问题。适用于企业内部知识库、HR政策解答及法务合规文档智能检索等多种场景。

智能问答文档检索