Make OpenAI Citation for File Retrieval RAG

该工作流结合OpenAI助手与向量存储技术,实现文件检索问答功能,能够从文件库中精准提取相关内容并生成带有引用的文本。它支持Markdown格式化和HTML转换,提升输出内容的可读性与专业性,确保生成信息的可靠性,适用于智能问答、内容创作、企业知识管理及教育科研等多种场景。

流程图
Make OpenAI Citation for File Retrieval RAG 工作流程图

工作流名称

Make OpenAI Citation for File Retrieval RAG

主要功能和亮点

该工作流结合了OpenAI助手和向量存储技术,实现了文件检索问答(Retrieval-Augmented Generation,RAG)功能,能够从文件库中精准检索相关内容并自动生成带有引用来源的输出文本。支持对输出内容进行Markdown格式化,甚至可选转为HTML格式,提升内容展示的可读性和专业度。

解决的核心问题

OpenAI助手在生成文本时,可能会出现异常字符或引用不准确的情况。此工作流通过访问OpenAI的文件向量存储,检索出处并动态插入格式化的引用,确保生成内容具备可靠的来源标注,提升信息的可信度和专业性。

应用场景

  • 需要自动引用和标注来源的智能问答系统
  • 内容创作或文档撰写时自动生成带有引用的文本
  • 企业内部知识库检索与回答
  • 教育、科研领域的文献引用辅助
  • 任何需要结合文件检索和自然语言生成的场景

主要流程步骤

  1. 触发器:在n8n内创建聊天按钮触发器,启动工作流。
  2. 调用OpenAI助手:使用包含向量存储的OpenAI助手执行文件检索问答。
  3. 获取完整对话线程内容:通过HTTP请求获取所有消息,保证引用完整性。
  4. 拆分消息与引用内容:多次拆分线程中消息、文本及引用信息,便于后续处理。
  5. 根据文件ID获取文件名:通过调用OpenAI文件API,获取引用文件的具体名称。
  6. 统一输出格式化:将引用及文本内容进行正则替换,生成带有Markdown格式引用的文本。
  7. 可选Markdown转HTML:支持将格式化后的Markdown内容转换为HTML,用于网页展示。
  8. 聚合处理:将所有引用和文本统一聚合,形成一条完整的输出。

涉及的系统或服务

  • OpenAI API(助手、文件管理、线程消息接口)
  • n8n自动化平台(包含HTTP请求节点、代码节点、Markdown转换节点等)

适用人群或使用价值

  • 开发者和自动化工程师:快速搭建基于OpenAI的文件检索问答系统。
  • 内容创作者与编辑人员:输出带有精准引用的文本,提升内容质量。
  • 企业知识管理人员:在内部知识库中实现智能检索与引用,方便信息追溯。
  • 教育和科研人员:辅助生成带有文献引用的专业内容,减少手动标注工作量。

该工作流由Davi Saranszky Mesquita设计,提供了高效且可定制的引用格式化方案,是实现智能文件检索与可信问答的理想工具。