RAG on living data
该工作流通过实时更新数据,实现了检索增强生成(RAG)功能,能够自动从Notion知识库获取最新内容,并进行文本分块和向量化处理,存储于Supabase向量数据库。结合OpenAI的GPT-4模型,提供上下文相关的智能问答,显著提升知识库的利用效率和准确性,适用于企业知识管理、客服支持、教育培训等场景,确保用户获取最新信息。
Tags
工作流名称
RAG on living data
主要功能和亮点
本工作流实现了基于实时更新数据的RAG(Retrieval-Augmented Generation,检索增强生成)流程,能够自动从Notion知识库中获取最新内容,进行文本分块与向量化处理,并存储于Supabase向量数据库中。结合OpenAI的GPT-4模型,实现上下文相关的智能问答,提升知识库内容的利用效率和准确性。
解决的核心问题
解决了知识库内容动态更新后,如何高效同步、更新向量化数据并支持基于上下文的智能问答的问题。通过自动检测Notion页面更新,删除旧向量数据并插入新向量,确保问答基于最新信息,避免数据冗余和信息过时。
应用场景
- 企业内部知识管理:自动同步和增强企业内部文档、手册、FAQ,实现智能问答。
- 客服支持系统:基于动态知识库,为客服提供准确、实时的答复支持。
- 教育培训:整合教学资料库,辅助学生和教师进行智能问答和内容检索。
- 产品文档查询:为用户提供实时更新的产品使用指南问答服务。
主要流程步骤
- 数据触发
- 通过定时器(Schedule Trigger)每分钟拉取Notion知识库中最近更新的页面。
- 数据获取与处理
- 获取更新页面的所有内容块(Get page blocks)。
- 将页面内容合并为单行文本(Concatenate to single string)。
- 按照设定的令牌数分割文本(Token Splitter),便于处理和向量化。
- 旧数据清理
- 删除Supabase向量存储中该页面对应的旧向量数据,避免数据冗余(Delete old embeddings if exist)。
- 向量化与存储
- 利用OpenAI Embeddings节点将文本块转换为向量。
- 将向量及相关元数据存入Supabase向量数据库(Supabase Vector Store)。
- 智能问答触发
- 通过聊天消息触发器(When chat message received)启动问答流程。
- 使用向量检索器(Vector Store Retriever)从向量数据库中检索相关内容。
- 结合OpenAI GPT-4模型进行上下文问答生成(OpenAI Chat Model + Question and Answer Chain)。
- 结果输出
- 返回基于最新知识库内容的智能问答结果。
涉及的系统或服务
- Notion:作为知识库数据源,提供实时页面和内容块访问。
- OpenAI:提供文本嵌入生成(Embeddings)和聊天语言模型(GPT-4)支持。
- Supabase:作为向量存储数据库,存储和检索文本向量数据。
- n8n:自动化工作流平台,协调各节点执行,实现流程自动化。
适用人群或使用价值
- 知识管理人员和企业数字化转型团队,助力构建智能知识库。
- 客服和支持团队,提升响应效率和准确率。
- 教育机构和培训师,方便内容智能检索和互动问答。
- 开发者和自动化爱好者,快速搭建基于实时数据的智能问答系统。
该工作流通过结合Notion的动态数据源与OpenAI强大的语言理解能力,配合Supabase高效的向量存储,实现了一个实时、智能且自动化的知识库问答解决方案,极大提升了信息获取的便捷性和精准度。
A/B Split Testing
该工作流实现了基于会话的A/B拆分测试,能够随机分配不同提示语(baseline和alternative)给用户,从而评估语言模型响应的效果。通过集成数据库记录会话及分配路径,并结合GPT-4o-mini模型,确保对话记忆的持续管理,提升测试的科学性和准确性。适用于AI产品研发、聊天机器人优化及多版本效果验证,帮助用户快速验证提示策略,优化交互体验。
Get Airtable data in Obsidian Notes
该工作流能够将Airtable数据库中的数据实时同步到Obsidian笔记中,用户只需在Obsidian中选择相关文本并发送请求,智能AI代理会理解查询意图并调用OpenAI模型,获取所需数据。最终,结果会自动插入到笔记中,简化了数据检索和知识管理的流程,提升了工作效率和用户体验。适合需要快速获取结构化数据的专业人士和团队协作用户。
CoinMarketCap_AI_Data_Analyst_Agent
该工作流构建了一个多智能体AI分析系统,整合了CoinMarketCap的实时数据,提供全面的加密货币市场洞察。用户可以通过Telegram快速获取币种行情、交易所持仓和去中心化交易数据的分析结果。系统可处理复杂查询,自动生成市场情绪和交易数据报告,助力投资者和研究人员做出精准决策,从而提升信息获取效率,简化操作流程。
Generate AI-Ready llms.txt Files from Screaming Frog Website Crawls
该工作流通过自动处理Screaming Frog导出的CSV文件,生成符合AI训练标准的`llms.txt`文件。它支持多语言环境,具备智能URL过滤和可选的AI文本分类功能,确保提取的内容高质量且相关性强。用户只需上传文件,即可获得结构化的数据,便于AI模型训练和网站内容优化,显著提升工作效率和数据处理的精准度。最终文件可方便地下载或直接保存至云存储。
Building RAG Chatbot for Movie Recommendations with Qdrant and Open AI
该工作流构建了一个智能电影推荐聊天机器人,利用检索增强生成(RAG)技术,结合Qdrant向量数据库和OpenAI语言模型,为用户提供个性化的电影推荐。通过导入丰富的IMDb数据,生成文本向量并进行高效的相似度搜索,能够深刻理解用户的电影偏好,优化推荐结果,提升用户互动体验,特别适用于在线影视平台和影评社区。
竞争对手调研智能代理
该工作流通过自动化智能代理,帮助用户高效进行竞争对手调研。用户只需输入目标公司官网链接,系统便能自动发现相似公司,采集并分析其基本信息、产品服务和客户评价。最终,所有数据将整合成详尽的报告,存储在Notion中,显著提升调研效率,解决了传统调研中信息分散和整理繁琐的问题,助力市场分析和战略决策。
RAG & GenAI App With WordPress Content
该工作流通过自动化抓取WordPress网站的文章和页面内容,实现基于检索增强生成式人工智能的智能问答系统。它对内容进行过滤、转换和向量化处理,并将数据存储在Supabase数据库中,支持高效的语义检索和动态问答。结合OpenAI的GPT-4模型,用户可以享受更精准的查询体验,同时实现了聊天记忆的持久化管理,增强了交互的上下文连续性,提升了网站内容的智能化利用价值。
Slack AI Chatbot with RAG for company staff
该工作流构建了一个智能聊天机器人,集成于Slack平台,使用RAG技术实时连接企业内部知识库,帮助员工快速查询公司文件、政策和流程。机器人支持自然语言交互,能够精准提取相关信息并以友好的格式回复,确保信息准确可靠。此系统不仅提升了信息获取效率,还自动化了IT支持和人力资源相关问题的响应,极大地改善了员工的工作体验和沟通效率。