🔐🦙🤖 Private & Local Ollama Self-Hosted LLM Router

该工作流实现了一个私有且本地部署的动态路由器,能够根据用户输入智能选择最适合的本地大型语言模型进行响应。支持多种专用模型,确保全流程本地运行,保障数据隐私与安全。内置决策树和分类规则,自动调度模型并管理上下文记忆,提升交互体验和任务处理效率,适合需要高效、多样化任务处理的用户群体。

Tags

本地部署智能路由

工作流名称

🔐🦙🤖 Private & Local Ollama Self-Hosted LLM Router

主要功能和亮点

该工作流实现了一个私有且本地部署的 Ollama 大型语言模型(LLM)动态路由器,能够根据用户输入的提示智能选择最合适的本地 Ollama 模型进行响应。支持多种专用模型(文本推理、多语言对话、编程辅助、视觉分析等),全流程本地运行,保障数据隐私与安全。工作流内置复杂的决策树和分类规则,实现自动化模型调度与上下文记忆管理,提升交互体验与任务处理效率。

解决的核心问题

在拥有多种本地 Ollama LLM 模型的环境中,用户往往难以手动判断并选择最适合当前任务的模型。此工作流通过智能分析用户请求,自动路由到最匹配的模型,消除技术门槛,保证任务高效精准完成,同时避免数据上传云端,保护隐私。

应用场景

  • AI 爱好者和开发者需要本地化且安全的多模型语言智能处理平台
  • 需处理多语言对话、复杂推理、代码生成与修复、图像及文档视觉分析的多样化任务
  • 企业或个人追求数据隐私,避免外部访问敏感信息的场景
  • 需要统一管理本地多模型资源,实现智能调度的自动化办公或研发环境

主要流程步骤

  1. 通过 Webhook 接收用户聊天消息(“When chat message received”节点)
  2. 由“LLM Router”节点基于预设的决策树和分类规则,分析用户输入并确定最合适的 Ollama 模型名称
  3. 路由结果传递给“AI Agent with Dynamic LLM”节点,调用对应的 Ollama 模型进行响应生成
  4. 利用“Router Chat Memory”和“Agent Chat Memory”节点维护会话上下文,实现连续对话记忆
  5. 响应返回至用户,实现本地化、智能且动态的多模型协同服务

涉及的系统或服务

  • Ollama 本地部署的多款大型语言模型(包括 qwq、llama3.2、phi4、qwen2.5-coder、granite3.2-vision、llama3.2-vision)
  • n8n 自动化工作流平台节点,如 LangChain 集成的聊天触发器、代理、记忆缓冲等
  • Webhook 用于接收外部聊天消息输入

适用人群或使用价值

  • AI 技术爱好者和研究人员,寻求本地无数据外泄的智能问答及任务处理解决方案
  • 软件开发者希望通过动态模型选择提升多场景代码辅助与文本处理效率
  • 企业用户及隐私敏感行业,需保证数据安全的同时享受先进的 AI 多模型协同能力
  • 任何希望构建智能、灵活且隐私友好的本地化大语言模型服务的团队或个人

此工作流示范了如何利用 n8n 强大且灵活的自动化能力,结合本地 Ollama LLM,实现多模型智能路由与协作,保障用户数据完全本地化处理,满足多样化复杂任务需求。

推荐模板

智能聊天助手工作流

该工作流实现了一个智能聊天助手,具备上下文记忆和计算能力。通过持续追踪用户会话,确保对话连贯性,避免信息遗漏。它能够处理复杂计算请求,提升用户体验,适用于在线客服、虚拟助理和教育辅导等场景。此助手集成了强大的语言理解与生成能力,适合开发者和企业构建高效的智能对话系统,显著提高交互质量和响应效率。

智能聊天上下文记忆

Discord MCP Chat Agent

该工作流通过接收 Discord 聊天消息,利用先进的语言模型和智能代理,实现自然语言的智能聊天交互和任务处理。它可以自动理解用户指令,简化 Discord 服务器的管理流程,提升用户互动效率,适用于社区管理、客服支持和智能助手等多种场景。灵活的结构允许用户根据需求自定义设置,增强了自动化和交互体验。

Discord机器人智能客服

AI Agent 聊天式Airtable数据助手

该工作流是一个智能数据助手,允许用户通过自然语言与Airtable数据库互动,简化数据查询与分析过程。用户只需输入问题,系统会智能解析请求,自动生成查询条件并执行操作。它支持数学运算和数据可视化,具备上下文记忆功能,能够进行多轮对话,提升交互效率。适用于业务人员、数据分析师和项目管理者,帮助他们更快速、便捷地获取和分析数据。

Airtable助手智能对话

多场景智能自动化示例集锦

该工作流集成了多种智能自动化功能,能够实现邮件的智能分类、PDF文档的语义问答以及智能预约管理。通过AI模型和向量数据库,用户可以高效处理邮件和文档信息,快速获取关键内容。同时,内置日历接口可自动安排会议,避免约会冲突,提升工作效率。适合需要高效管理信息和日程的企业用户,优化客户体验和团队协作。

智能自动化邮件分类

AI Voice Chat using Webhook, Memory Manager, OpenAI, Google Gemini & ElevenLabs

该工作流构建了一套完整的AI语音聊天系统,能够实时将用户语音转录为文本,并通过上下文记忆管理实现多轮对话的理解与生成。结合先进的语言模型和高质量的文本转语音技术,系统能够提供自然流畅的语音回复,适用于智能客服、语音助手等场景,提升用户交互体验与效率。

智能语音多轮对话

🐋🤖 DeepSeek AI Agent + Telegram + LONG TERM Memory 🧠

该工作流结合了智能代理与聊天机器人技术,能够自动接收并处理Telegram用户消息。通过个性化的智能分析和长时记忆功能,它实现了上下文相关的互动,存储重要信息于Google Docs,以提供个性化服务和高效交互。同时,具备严格的用户身份验证机制,确保交互安全,适用于智能客服、个人助理等多种场景,提升用户体验和信息管理效率。

Telegram机器人长时记忆

WhatsApp 多媒体智能交互助手

该工作流旨在通过 WhatsApp 实现对用户发送的多媒体消息的自动识别与智能处理。利用先进的 AI 技术,能够实时转写音频、解析视频、识别图片内容并生成智能回复,有效简化客服、咨询与预约等业务流程,提升用户体验和处理效率。适用于企业客服、营销、教育等多个场景,助力多媒体交互的自动化和智能化。

WhatsApp智能助手多模态AI

Insert and retrieve documents

该工作流旨在自动抓取Paul Graham网站上的最新文章,提取并清洗其正文内容,生成向量后存储在Milvus数据库中。用户可以通过聊天接口进行查询,系统会基于向量检索相关文本,并利用GPT-4模型进行智能问答,确保回答准确且可追溯。适用于知识库建设、智能客服、内容聚合和研究辅助,提升了文本数据的管理与利用效率。

文本爬取语义检索