GitHub Stars 分页获取与网页数据提取示例工作流

该工作流展示了如何自动化获取和处理API数据，特别是通过分页请求抓取GitHub用户的收藏项目。它支持自动递增页码，判断数据结束条件，实现完整数据获取。同时，该流程还演示了如何从维基百科随机页面提取文章标题，结合HTTP请求与HTML内容提取，适用于需要批量抓取和处理多来源数据的场景，帮助用户高效搭建自动化工作流。

API分页网页抓取

工作流名称

主要功能和亮点

该工作流展示了如何使用 n8n 的 HTTP Request 节点实现多种常见数据获取场景，重点突出分页请求的自动循环处理、网页内容抓取及HTML元素提取功能。通过配置分页参数，自动递增页码并判断结束条件，实现对 GitHub 用户收藏项目的完整抓取；同时展示了如何从维基百科随机页面获取文章标题，演示了 HTTP 请求与 HTML 提取的结合应用。

解决的核心问题

自动处理 API 分页请求，避免手动重复调用，保证获取到完整数据。
解析网页二进制内容，提取指定HTML元素信息，支持网页数据抓取。
将复杂的 HTTP 请求响应拆分成易于管理的独立数据项，方便后续处理。

应用场景

需要从支持分页的API接口批量抓取数据的自动化场景，如获取用户收藏、历史记录、订单列表等。
从网页抓取指定内容（如文章标题、新闻摘要、产品信息等）并进行自动化处理。
结合多数据源的异构数据整合和自动化工作流搭建。

主要流程步骤

手动触发工作流启动。
通过 Set 节点初始化分页参数（当前页码、每页条数）及目标 GitHub 用户名。
发起对 GitHub API 的分页请求获取用户收藏项目（Stars）。
利用 If 节点判断当前请求是否返回空数据，决定是否继续分页循环。
若未结束，通过 Set 节点将页码递增，继续循环请求下一页数据。
并行执行获取 Mock Albums 的请求，拆分响应数据为独立项。
请求维基百科随机页面，提取页面标题作为示例展示 HTML 内容抽取能力。

涉及的系统或服务

GitHub API：用于分页获取用户收藏项目数据。
JSONPlaceholder API：模拟数据接口，用于示例演示。
Wikipedia：随机页面抓取及HTML内容提取。
n8n 自身节点：HTTP Request、Set、If、Item Lists、HTML Extract、Manual Trigger。

适用人群或使用价值

自动化开发者和运维人员，需快速搭建API数据抓取与处理流程。
数据分析师和产品经理，关注如何自动获取和整合多来源数据。
技术爱好者，学习API分页处理、网页数据爬取和n8n节点组合应用。
企业希望降低人工数据采集成本，实现数据驱动的业务流程自动化。

Dashboard

Dashboard 工作流通过自动抓取和整合来自 Docker Hub、npm、GitHub 和 Product Hunt 等多个平台的关键指标，实时更新并展示在自定义仪表盘上。它解决了开发者在管理开源项目时面临的数据分散和更新不及时的问题，提高了数据获取的效率和准确性。适用于开源项目维护者、产品经理等，帮助他们全面监控项目健康状况，优化决策和社区运营。

多平台监控数据可视化

HubSpot联系人数据分页获取与整合

该工作流通过HubSpot CRM API自动化实现联系人数据的分页获取与整合，简化了手动管理分页逻辑的复杂性。用户只需手动触发流程，系统便会循环请求所有分页数据，并将其整合为完整列表。这一过程避免了数据遗漏，提升了数据获取的效率与准确性，适用于市场营销、客户管理和数据分析等多种场景，助力企业更有效地管理客户资源。

HubSpot分页数据整合