My workflow 3

该工作流实现了一个智能文档解析与分析系统,用户通过表单上传多个文件并提供邮箱后,系统自动完成文件拆分、解析、内容转换和翻译,最终生成结构化分析报告并发送至用户邮箱。同时,结合向量数据库和问答功能,用户可通过聊天界面对文档进行交互式提问,显著提升文档信息的可访问性和利用效率,适用于企业、教育和跨语言团队等多种场景。

流程图
My workflow 3 工作流程图

工作流名称

My workflow 3

主要功能和亮点

该工作流实现了一个基于表单文件上传的智能文档解析与分析系统。用户通过表单提交多个文件及邮箱后,系统自动完成文件拆分、上传解析、状态查询、内容转换和多语言翻译,最终生成结构化的分析报告并通过邮件发送给用户。同时,结合向量数据库和多轮问答能力,支持用户通过聊天界面对文档内容进行交互式提问,提升文档信息的可访问性和利用效率。

解决的核心问题

  • 自动化处理多文件上传及拆分,避免手动繁琐操作
  • 高效调用外部API对文档进行深度解析,生成Markdown格式的内容
  • 支持多语言内容自动识别与翻译,消除语言障碍
  • 结构化分析文档内容,提取关键信息,便于快速理解
  • 通过向量数据库存储解析内容,实现智能检索与问答
  • 及时将分析结果以邮件形式发送给用户,提升反馈效率

应用场景

  • 企业或个人需要批量上传复杂文档,自动生成易读报告
  • 跨语言团队需要自动翻译并分析文档内容
  • 需要基于文档内容建立知识库,实现智能问答机器人
  • 教育、法律、科研等行业对文档解析和信息抽取有需求
  • 客户服务中自动处理用户上传的文件并回复详细分析结果

主要流程步骤

  1. 表单触发:用户通过带有多个文件上传项和邮箱填写的表单提交数据
  2. 文件拆分:将上传的多个二进制文件拆分成独立项
  3. 文档解析:逐个文件调用LlamaIndex解析API,上传文件并轮询查询解析状态
  4. 内容获取:成功解析后,获取Markdown格式的文档内容
  5. 内容聚合:合并多个文档内容,进行语言检测和自动翻译(非英文翻译成英文)
  6. 深入分析:对聚合内容进行结构化分析、信息提取和格式优化
  7. 生成文件:将分析结果转换成文本文件格式
  8. 知识入库:将文本内容通过Mistral Cloud向量嵌入存入Pinecone向量数据库
  9. 发送邮件:将分析报告及互动链接通过Gmail发送给用户邮箱
  10. 聊天问答:用户可通过邮件中的聊天链接,向机器人提问,实现基于解析文档的智能问答

涉及的系统或服务

  • n8n:工作流自动化平台
  • 表单触发器 (formTrigger):接收用户文件和邮箱输入
  • LlamaIndex Cloud API:文档解析与Markdown内容生成
  • Google Gemini Chat Model:多处用于语言模型交互、翻译、分析及智能问答
  • Mistral Cloud Embeddings:生成文本向量表示
  • Pinecone Vector Store:向量数据库存储与检索
  • Gmail:邮件发送服务,推送分析结果和交互链接
  • Webhook 和聊天触发器:实现用户与智能问答机器人的实时交互

适用人群或使用价值

  • 内容分析师和数据科学家:自动化文档处理与信息提取,节省大量人工时间
  • 企业客户服务团队:快速响应用户上传文件,提供详细专业反馈
  • 跨国团队与多语言环境用户:自动翻译文档内容,消除语言障碍
  • 教育和研究机构:便捷生成结构化学习资料与研究报告
  • 软件开发者和自动化爱好者:利用n8n集成多种AI服务,实现复杂文档处理自动化

该工作流为用户提供了一套从文件上传、智能解析到多轮问答和邮件通知的完整闭环解决方案,极大提升了文档处理的智能化和交互体验。