Make OpenAI Citation for File Retrieval RAG

该工作流集成了智能助手和向量存储,旨在实现文件检索后的智能问答,并自动为检索内容添加文献引用。用户可以将输出结果格式化为Markdown或HTML,方便生成带动态引用编号的专业文档,提升信息的可信度和可追溯性。适用于科研、教育、法律等领域,解决了答案中缺失引用和奇怪字符的问题,帮助用户高效生成规范文档。

Tags

文件检索自动引用

工作流名称

Make OpenAI Citation for File Retrieval RAG

主要功能和亮点

该工作流通过集成OpenAI助手和向量存储,实现基于文件检索的智能问答,自动为检索到的内容添加引用和来源标注。支持将输出结果格式化为Markdown或HTML,方便用户生成带有动态引用编号(如Citation 1, 2, 3)的专业文档内容,提升信息的可信度和可追溯性。

解决的核心问题

  • 解决OpenAI助手在生成答案时出现奇怪字符和缺失引用的问题;
  • 实现对向量存储文件的精准检索,并自动附加正确的文献引用;
  • 统一处理多个消息线程中的引用,避免遗漏和混乱;
  • 提供灵活的输出格式,满足不同场景的展示需求。

应用场景

  • 需要基于大量文件资料进行智能问答和内容生成的科研、教育、法律及信息服务领域;
  • 内容创作者和技术团队需要自动化生成带有规范引用的报告、文档或网页内容;
  • 任何希望提升AI助手回答准确性和可信度的企业和个人。

主要流程步骤

  1. 触发与对话启动:通过在n8n平台内置的聊天触发器启动对话交互。
  2. 调用OpenAI助手:使用内置的OpenAI助手及其向量存储进行文件检索问答。
  3. 获取完整消息线程内容:通过HTTP请求获取OpenAI消息线程中的所有内容,保证引用完整。
  4. 拆分消息与引用:分别拆分消息内容和对应的引用注释。
  5. 文件名检索:根据文件ID通过OpenAI API获取对应文件名。
  6. 整理与聚合数据:将拆分的引用和文本进行聚合,统一管理。
  7. 格式化输出:使用自定义代码块将引用内容替换成含文件名的格式,并可选地将Markdown转换为HTML。
  8. 缓存与记忆管理:通过窗口缓冲记忆节点保持对话上下文。

涉及的系统或服务

  • OpenAI API:提供智能问答和文件检索能力。
  • n8n平台:作为自动化工作流执行环境,调度各节点执行。
  • HTTP请求节点:调用OpenAI的文件和消息线程API接口。
  • Markdown/HTML格式化:支持动态输出格式转换。

适用人群或使用价值

  • 研究人员和学术工作者,提升文献引用自动化程度;
  • 内容编辑和技术写作团队,提高文档生成效率及准确性;
  • 企业知识管理者,通过自动引用提升内部知识库质量;
  • AI产品开发者,增强智能助手的专业性和用户信任度。

此工作流由Davi Saranszky Mesquita设计,具备高度可定制性,用户可根据需求调整输出格式,灵活应用于各种文件检索与引用场景。

推荐模板

Load Prompts from Github Repo and auto populate n8n expressions

该工作流能够从指定的GitHub仓库自动加载文本提示文件,提取并替换其中的变量占位符,生成完整的提示内容供AI模型使用。它具备变量校验机制,确保所有必需变量被正确赋值,避免错误并提高效率。同时,结合Ollama聊天模型和LangChain AI Agent,实现从文本提示到智能响应的全流程自动化,适用于多种需要动态生成内容的场景。

提示管理AI文本生成

Daily AI News Translation & Summary with GPT-4 and Telegram Delivery

该工作流每天定时自动从主流新闻API抓取最新的人工智能相关新闻,并通过先进的AI模型进行筛选、摘要和翻译成繁体中文。最终,整理好的新闻摘要将及时推送至指定的Telegram聊天群组或频道,帮助用户高效获取前沿AI资讯,解决了手动搜索和翻译的繁琐问题,确保信息的时效性和连续性,适合各类AI行业从业人员和普通用户使用。

AI新闻自动翻译

SearchApi Youtube Video Summary

该工作流通过输入YouTube视频ID,自动提取视频转录文本并进行智能摘要处理。利用SearchApi获取文本后,经过多步拆分与内容合并,结合OpenAI GPT-4模型生成简洁的总结。这一流程有效解决了从长视频中快速提取关键信息的难题,适用于内容创作者、教育者和市场调研人员,显著提高了信息获取的效率和准确性。

视频摘要智能转录

Image to license plate number

该工作流能自动识别并提取上传车辆图片中的车牌号码,直接返回纯净的车牌字符,免去用户手动输入。通过结合先进的大语言模型,显著提高了车牌识别的效率和准确性,简化了传统车牌提取流程。适用于交通管理、停车场、物流监控等多个场景,帮助用户实现车辆信息的快速自动化采集,提升管理智能化水平,节省时间和人力成本。

车牌识别大语言模型

Tech Radar

Tech Radar 工作流通过整合多种技术实现了企业技术雷达数据的自动化管理与智能问答。它将Google Sheets中的数据转化为结构化文本,并存储于向量与关系型数据库中,支持多维度查询。配备智能AI代理,能够精准响应用户提问,提升信息检索效率。同时,定时同步更新确保数据的时效性,降低非技术人员的信息获取门槛,助力技术决策与内部沟通。

技术雷达智能问答

Crypto News & Sentiment

该工作流通过整合多家主流加密货币新闻源的RSS资讯,并利用先进的AI模型进行智能分析,自动提取关键词和筛选相关报道,生成新闻摘要和市场情绪分析。最终,结果会通过Telegram机器人实时推送给用户,帮助投资者和分析师高效获取个性化的加密新闻和市场动态,解决信息筛选繁琐的问题。

加密新闻情绪分析

UK Practical Driving Test Satisfaction Interview(英国实用驾驶考试满意度访谈)

该工作流创建了一个自动化的用户访谈系统,利用AI智能代理引导访谈并动态生成开放式问题。用户通过在线表单回答,系统实时记录对话并支持随时结束访谈。访谈数据快速存储于Redis,并可导出至Google Sheets,便于后续分析。该系统降低了传统访谈的人力成本,实现了24小时在线的高效访谈体验,适用于市场调研、产品反馈和教育机构等多种场景。

智能访谈自动化调研

从PDF中提取数据并对比Claude 3.5 Sonnet与Gemini 2.0 Flash能力

该工作流旨在实现PDF文档内容的自动提取与智能解析,用户可直接上传PDF文件,无需OCR识别,简化流程。它同时调用Claude 3.5 Sonnet和Gemini 2.0 Flash两个AI模型,便于比较二者在数据提取效果、响应速度及成本上的表现。支持自定义提取指令,输出结果可调整为JSON格式,适用于财务发票、合同等文档的关键信息提取,提升数据处理效率与自动化水平。

PDF提取AI模型对比