RAG on living data

该工作流通过实时更新数据,实现了检索增强生成(RAG)功能,能够自动从Notion知识库获取最新内容,并进行文本分块和向量化处理,存储于Supabase向量数据库。结合OpenAI的GPT-4模型,提供上下文相关的智能问答,显著提升知识库的利用效率和准确性,适用于企业知识管理、客服支持、教育培训等场景,确保用户获取最新信息。

Tags

智能问答向量检索

工作流名称

RAG on living data

主要功能和亮点

本工作流实现了基于实时更新数据的RAG(Retrieval-Augmented Generation,检索增强生成)流程,能够自动从Notion知识库中获取最新内容,进行文本分块与向量化处理,并存储于Supabase向量数据库中。结合OpenAI的GPT-4模型,实现上下文相关的智能问答,提升知识库内容的利用效率和准确性。

解决的核心问题

解决了知识库内容动态更新后,如何高效同步、更新向量化数据并支持基于上下文的智能问答的问题。通过自动检测Notion页面更新,删除旧向量数据并插入新向量,确保问答基于最新信息,避免数据冗余和信息过时。

应用场景

  • 企业内部知识管理:自动同步和增强企业内部文档、手册、FAQ,实现智能问答。
  • 客服支持系统:基于动态知识库,为客服提供准确、实时的答复支持。
  • 教育培训:整合教学资料库,辅助学生和教师进行智能问答和内容检索。
  • 产品文档查询:为用户提供实时更新的产品使用指南问答服务。

主要流程步骤

  1. 数据触发
    • 通过定时器(Schedule Trigger)每分钟拉取Notion知识库中最近更新的页面。
  2. 数据获取与处理
    • 获取更新页面的所有内容块(Get page blocks)。
    • 将页面内容合并为单行文本(Concatenate to single string)。
    • 按照设定的令牌数分割文本(Token Splitter),便于处理和向量化。
  3. 旧数据清理
    • 删除Supabase向量存储中该页面对应的旧向量数据,避免数据冗余(Delete old embeddings if exist)。
  4. 向量化与存储
    • 利用OpenAI Embeddings节点将文本块转换为向量。
    • 将向量及相关元数据存入Supabase向量数据库(Supabase Vector Store)。
  5. 智能问答触发
    • 通过聊天消息触发器(When chat message received)启动问答流程。
    • 使用向量检索器(Vector Store Retriever)从向量数据库中检索相关内容。
    • 结合OpenAI GPT-4模型进行上下文问答生成(OpenAI Chat Model + Question and Answer Chain)。
  6. 结果输出
    • 返回基于最新知识库内容的智能问答结果。

涉及的系统或服务

  • Notion:作为知识库数据源,提供实时页面和内容块访问。
  • OpenAI:提供文本嵌入生成(Embeddings)和聊天语言模型(GPT-4)支持。
  • Supabase:作为向量存储数据库,存储和检索文本向量数据。
  • n8n:自动化工作流平台,协调各节点执行,实现流程自动化。

适用人群或使用价值

  • 知识管理人员和企业数字化转型团队,助力构建智能知识库。
  • 客服和支持团队,提升响应效率和准确率。
  • 教育机构和培训师,方便内容智能检索和互动问答。
  • 开发者和自动化爱好者,快速搭建基于实时数据的智能问答系统。

该工作流通过结合Notion的动态数据源与OpenAI强大的语言理解能力,配合Supabase高效的向量存储,实现了一个实时、智能且自动化的知识库问答解决方案,极大提升了信息获取的便捷性和精准度。

推荐模板

A/B Split Testing

该工作流实现了基于会话的A/B拆分测试,能够随机分配不同提示语(baseline和alternative)给用户,从而评估语言模型响应的效果。通过集成数据库记录会话及分配路径,并结合GPT-4o-mini模型,确保对话记忆的持续管理,提升测试的科学性和准确性。适用于AI产品研发、聊天机器人优化及多版本效果验证,帮助用户快速验证提示策略,优化交互体验。

A/B测试提示语优化

Get Airtable data in Obsidian Notes

该工作流能够将Airtable数据库中的数据实时同步到Obsidian笔记中,用户只需在Obsidian中选择相关文本并发送请求,智能AI代理会理解查询意图并调用OpenAI模型,获取所需数据。最终,结果会自动插入到笔记中,简化了数据检索和知识管理的流程,提升了工作效率和用户体验。适合需要快速获取结构化数据的专业人士和团队协作用户。

Obsidian集成Airtable同步

CoinMarketCap_AI_Data_Analyst_Agent

该工作流构建了一个多智能体AI分析系统,整合了CoinMarketCap的实时数据,提供全面的加密货币市场洞察。用户可以通过Telegram快速获取币种行情、交易所持仓和去中心化交易数据的分析结果。系统可处理复杂查询,自动生成市场情绪和交易数据报告,助力投资者和研究人员做出精准决策,从而提升信息获取效率,简化操作流程。

加密货币分析多智能体

Generate AI-Ready llms.txt Files from Screaming Frog Website Crawls

该工作流通过自动处理Screaming Frog导出的CSV文件,生成符合AI训练标准的`llms.txt`文件。它支持多语言环境,具备智能URL过滤和可选的AI文本分类功能,确保提取的内容高质量且相关性强。用户只需上传文件,即可获得结构化的数据,便于AI模型训练和网站内容优化,显著提升工作效率和数据处理的精准度。最终文件可方便地下载或直接保存至云存储。

网站爬虫文本生成

Building RAG Chatbot for Movie Recommendations with Qdrant and Open AI

该工作流构建了一个智能电影推荐聊天机器人,利用检索增强生成(RAG)技术,结合Qdrant向量数据库和OpenAI语言模型,为用户提供个性化的电影推荐。通过导入丰富的IMDb数据,生成文本向量并进行高效的相似度搜索,能够深刻理解用户的电影偏好,优化推荐结果,提升用户互动体验,特别适用于在线影视平台和影评社区。

电影推荐向量检索

竞争对手调研智能代理

该工作流通过自动化智能代理,帮助用户高效进行竞争对手调研。用户只需输入目标公司官网链接,系统便能自动发现相似公司,采集并分析其基本信息、产品服务和客户评价。最终,所有数据将整合成详尽的报告,存储在Notion中,显著提升调研效率,解决了传统调研中信息分散和整理繁琐的问题,助力市场分析和战略决策。

竞争对手调研多智能体分析

RAG & GenAI App With WordPress Content

该工作流通过自动化抓取WordPress网站的文章和页面内容,实现基于检索增强生成式人工智能的智能问答系统。它对内容进行过滤、转换和向量化处理,并将数据存储在Supabase数据库中,支持高效的语义检索和动态问答。结合OpenAI的GPT-4模型,用户可以享受更精准的查询体验,同时实现了聊天记忆的持久化管理,增强了交互的上下文连续性,提升了网站内容的智能化利用价值。

RAG应用智能问答

Slack AI Chatbot with RAG for company staff

该工作流构建了一个智能聊天机器人,集成于Slack平台,使用RAG技术实时连接企业内部知识库,帮助员工快速查询公司文件、政策和流程。机器人支持自然语言交互,能够精准提取相关信息并以友好的格式回复,确保信息准确可靠。此系统不仅提升了信息获取效率,还自动化了IT支持和人力资源相关问题的响应,极大地改善了员工的工作体验和沟通效率。

Slack机器人RAG问答