Agent with custom HTTP Request
该工作流结合智能AI代理与OpenAI GPT-4模型,实现了网页内容的自动抓取与处理。用户输入聊天消息后,系统自动生成HTTP请求参数,从指定URL获取网页内容,并对HTML进行深度清洗,最后输出为Markdown格式。支持完整与简化两种抓取模式,智能处理请求错误,并提供反馈和建议,适用于内容监控、信息采集及AI问答系统,提升信息获取效率,减少人工干预。
Tags
工作流名称
Agent with custom HTTP Request
主要功能和亮点
该工作流通过一个智能AI Agent(ReAct AI Agent)结合OpenAI GPT-4模型,接收用户手动输入的聊天消息,智能生成符合HTTP请求格式的查询参数,从指定URL抓取网页内容,并对网页HTML进行深度清洗和简化,最终将内容转换为Markdown格式输出。支持两种内容抓取模式(完整和简化),并能自动处理请求错误,给予合理反馈和调整建议。
解决的核心问题
- 自动化抓取网页内容并智能提取有效信息,避免手动解析网页带来的繁琐和低效。
- 通过AI Agent指导请求参数构建,降低API调用复杂度和错误率。
- 清理网页中冗余的脚本、样式和多媒体标签,减少无效信息干扰。
- 针对内容长度做限制,防止过长内容影响后续处理和存储。
- 提供简化模式,进一步压缩内容体积,满足不同应用场景需求。
应用场景
- 需要从网页抓取内容并智能整理的自动化流程,如内容监控、信息采集、数据分析前的清洗。
- AI问答系统中,结合网页实时数据增强回答准确性。
- 开发者或业务人员快速获取网页精简文本内容,方便后续处理或展示。
- 自动化客服或知识管理系统,后台自动更新网页内容摘要。
主要流程步骤
- 监听用户手动触发的聊天消息(On new manual Chat Message)。
- 由ReAct AI Agent处理输入,生成HTTP请求参数(如url和method)。
- 解析查询参数并设置内容长度限制(CONFIG节点)。
- 发送HTTP请求获取网页HTML。
- 判断请求是否出错,错误则生成提示信息。
- 提取网页标签内内容。
- 移除
- 根据method参数决定是否简化内容(去除链接和图片URL)。
- 将清理后的HTML转换为Markdown格式。
- 检查内容长度,超长时返回错误提示。
- 返回最终的页面内容供后续使用。
涉及的系统或服务
- OpenAI GPT-4(通过OpenAI Chat Model节点调用)
- 自定义HTTP请求(n8n内置HTTP Request节点)
- n8n Langchain插件(ReAct AI Agent及相关工具节点)
- Markdown转换节点(将HTML转换为Markdown格式)
适用人群或使用价值
- 自动化开发者和技术人员,帮助构建智能内容采集与处理工具。
- 内容运营和数据分析人员,快速获得结构化网页文本。
- AI应用开发者,利用网页实时数据增强智能问答和知识库。
- 企业和团队希望提升信息获取效率,减少人工干预的业务场景。
该工作流集成AI智能与网页数据抓取,极大提升了内容获取的自动化和智能化水平,是构建现代信息服务平台的重要基础组件。
News Extraction
该工作流通过自动抓取指定新闻网站的最新内容,提取新闻的发布时间、标题和正文,并利用AI技术生成每条新闻的摘要及关键技术关键词,最终将整理后的数据存入数据库。这一过程实现了对无RSS新闻源的高效监控与分析,适用于媒体监控、市场调研和内容管理等多种场景,大幅提升了信息获取的效率与准确性。
News Extraction
该工作流能够自动抓取指定新闻网站的最新新闻文章,无需依赖RSS订阅。它定期提取文章链接、发布日期、标题和正文内容,并使用GPT-4模型生成简短摘要和提取关键技术关键词。整理后的结构化数据将保存在NocoDB数据库中,方便后续检索和分析,极大提高了新闻监控和内容管理的效率,适合企业、媒体和数据分析师等使用。
Open Deep Research - AI-Powered Autonomous Research Workflow
该工作流利用AI语言模型和多种数据源,实现自动化的深度信息检索与研究报告生成。用户输入查询后,系统生成精准搜索关键词,通过SerpAPI进行网络搜索,并结合Jina AI进行内容分析,最终整合成结构化的研究报告。此流程提高了研究效率,确保信息提取的连贯性和准确性,适用于学术研究、市场调研、内容创作和企业决策等场景,帮助用户快速获取高质量资料。
Make OpenAI Citation for File Retrieval RAG
该工作流集成了智能助手和向量存储,旨在实现文件检索后的智能问答,并自动为检索内容添加文献引用。用户可以将输出结果格式化为Markdown或HTML,方便生成带动态引用编号的专业文档,提升信息的可信度和可追溯性。适用于科研、教育、法律等领域,解决了答案中缺失引用和奇怪字符的问题,帮助用户高效生成规范文档。
Load Prompts from Github Repo and auto populate n8n expressions
该工作流能够从指定的GitHub仓库自动加载文本提示文件,提取并替换其中的变量占位符,生成完整的提示内容供AI模型使用。它具备变量校验机制,确保所有必需变量被正确赋值,避免错误并提高效率。同时,结合Ollama聊天模型和LangChain AI Agent,实现从文本提示到智能响应的全流程自动化,适用于多种需要动态生成内容的场景。
Daily AI News Translation & Summary with GPT-4 and Telegram Delivery
该工作流每天定时自动从主流新闻API抓取最新的人工智能相关新闻,并通过先进的AI模型进行筛选、摘要和翻译成繁体中文。最终,整理好的新闻摘要将及时推送至指定的Telegram聊天群组或频道,帮助用户高效获取前沿AI资讯,解决了手动搜索和翻译的繁琐问题,确保信息的时效性和连续性,适合各类AI行业从业人员和普通用户使用。
SearchApi Youtube Video Summary
该工作流通过输入YouTube视频ID,自动提取视频转录文本并进行智能摘要处理。利用SearchApi获取文本后,经过多步拆分与内容合并,结合OpenAI GPT-4模型生成简洁的总结。这一流程有效解决了从长视频中快速提取关键信息的难题,适用于内容创作者、教育者和市场调研人员,显著提高了信息获取的效率和准确性。
Image to license plate number
该工作流能自动识别并提取上传车辆图片中的车牌号码,直接返回纯净的车牌字符,免去用户手动输入。通过结合先进的大语言模型,显著提高了车牌识别的效率和准确性,简化了传统车牌提取流程。适用于交通管理、停车场、物流监控等多个场景,帮助用户实现车辆信息的快速自动化采集,提升管理智能化水平,节省时间和人力成本。