Apify Youtube MCP Server 工作流

该工作流通过 MCP 服务器触发器实现对 YouTube 视频的自动搜索和字幕抓取,利用 Apify 的服务绕过官方限制,确保高效稳定的数据采集。支持视频搜索、字幕下载和使用情况报告,简化数据处理,便于后续分析与展示。同时,内置的配额监控功能能够实时反馈使用情况,帮助用户合理管理资源,适用于研究人员、内容创作者和数据工程师等多种场景。

Tags

Youtube抓取自动化采集

工作流名称

Apify Youtube MCP Server 工作流

主要功能和亮点

  • 通过 MCP(Machine-Client-Protocol)服务器触发器,实现对 Youtube 视频的搜索和字幕抓取功能。
  • 集成 Apify.com 的 Youtube 抓取服务,绕过官方低速率限制,保证搜索和字幕下载的稳定与高效。
  • 支持三大核心操作:Youtube 视频搜索、视频字幕获取、以及 Apify 账户的使用情况报告。
  • 结果数据经过简化和聚合,方便后续处理和展示。
  • 内置使用配额监控,实时反馈月度使用和消费情况,帮助用户合理控制资源。

解决的核心问题

  • 官方 Youtube API 调用频率限制导致查询受限,影响数据采集的连续性和效率。
  • 手动搜索视频及下载字幕等信息繁琐,难以批量和自动化处理。
  • 难以实时了解第三方抓取服务(Apify)账户的使用状态和费用消耗。

应用场景

  • 研究人员和内容创作者自动化获取 Youtube 视频及其字幕内容,用于文本分析、内容整理和研究报告。
  • 数据工程师或自动化开发者构建基于 Youtube 视频数据的应用或服务。
  • 需要监控和管理 Apify 抓取服务使用量和费用的运维人员或项目管理者。

主要流程步骤

  1. 通过 MCP Server Trigger 接收外部工作流的调用请求,传入操作类型和参数。
  2. 根据操作类型(youtube_search、youtube_transcripts、usage_metrics)切换执行不同流程。
  3. Youtube Search:调用 Apify Youtube Scraper 接口,按照用户查询关键词抓取视频列表元数据。
  4. 简化搜索结果字段,聚合多条视频数据生成统一响应。
  5. Youtube Transcripts:调用 Apify 同一抓取服务,针对指定视频 URL 下载英文字幕文本。
  6. 简化并聚合字幕文本及视频信息,便于后续使用。
  7. Usage Metrics:通过 Apify API 查询当前账户的月度使用情况和消费限额,格式化并输出详细的资源消耗明细。
  8. 将结果返回给 MCP 客户端,实现自动化交互。

涉及的系统或服务

  • Apify.com:第三方 Youtube 视频抓取和字幕下载服务,提供稳定的 API 接口。
  • n8n MCP Server Trigger:作为工作流入口,支持外部通过 MCP 协议调用本工作流。
  • HTTP 请求节点:负责与 Apify API 通信。
  • 数据处理节点(Set、Aggregate):简化和整合原始数据,提升数据可用性。

适用人群或使用价值

  • 需要自动化采集 Youtube 视频及对应字幕内容的研究人员、内容分析师。
  • 自动化开发者和数据集成工程师,构建基于多媒体内容的智能应用。
  • 使用 Apify 抓取服务的客户,方便监控使用额度和成本。
  • 希望通过 MCP 协议实现多平台数据交互的技术团队。

此工作流以强大的 Apify 抓取能力为基础,结合 n8n 灵活的触发和数据处理节点,打造了一个高效、可靠的 Youtube 搜索与字幕采集解决方案。只需配置 Apify 账户和 MCP 客户端,即可实现自动化的视频数据研究与分析,极大提升工作效率和数据质量。

推荐模板

图片智能识别与整理自动化流程

该自动化流程利用谷歌自定义搜索API获取街景照片,接着通过AWS Rekognition进行内容标签识别,并将图片名称、链接及识别标签整理后保存至Google Sheets。它有效解决了传统人工分类的低效和错误问题,自动化地实现图片获取、智能分析及结构化存储,提升了信息管理效率,适用于媒体、广告、电子商务等多个领域,帮助用户节省时间和成本。

图片识别自动整理

Youtube Video Transcript Extraction

该工作流能够自动从YouTube视频中提取字幕文本,并对其进行清理和格式优化,生成易读的文字稿。通过调用第三方API,用户只需输入视频链接,便可快速获取整理后的字幕,省去繁琐的手动操作。适用于内容创作者、教育机构和市场分析人员,提升了视频转录的效率和准确度,极大地简化了内容处理过程。

视频转录字幕提取

Telegram天气查询机器人工作流

该工作流通过Telegram机器人为用户提供便捷的实时天气查询服务,支持多个欧洲首都的天气信息获取。用户只需简单的聊天命令,便可收到文字和专业的可视化天气数据。机器人智能识别命令,友好提示无效输入,并在出现错误时及时反馈,提升了交互体验。无论是个人查询、旅游规划,还是企业提醒,该工具都能有效满足不同需求。

Telegram机器人天气可视化

随机用户数据获取与多格式处理自动化工作流

该工作流通过调用随机用户API,自动抓取用户信息并实现数据的多格式转换与存储。它将用户数据实时追加到Google Sheets,生成CSV文件并转换为JSON格式,随后通过邮件发送。此流程提高了数据采集与共享的效率,减少手动操作的风险,适用于市场调研、数据处理及团队协作等场景,显著提升工作效率。

数据自动化多格式转换

国际空间站轨迹数据采集与存储自动化

该工作流实现了国际空间站轨迹数据的自动化采集与存储。通过定时调用API获取实时的纬度、经度和时间戳信息,并将这些数据高效地存入TimescaleDB数据库,确保数据的实时性和准确性。此方案解决了手动记录的低效问题,适用于航天科研、教育展示及数据分析等多种场景,为相关人员提供了可靠的时序数据支持,提升了数据应用的价值。

空间站轨迹时序数据库

Extract information from an image of a receipt(从收据图片中提取信息)

该工作流能够自动从收据图片中提取关键信息,如商户、金额和日期等。通过HTTP请求获取收据图片并调用智能文档识别API,实现精准识别与解析,显著提高手动录入的效率和准确度。适用于财务报销、费用管理及票据数字化存档等场景,帮助用户快速获取结构化信息,减少错误,提升数据管理与分析能力。

收据识别OCR提取

ETL pipeline

该工作流实现了自动化的ETL数据管道,定期从Twitter抓取特定话题的推文,进行情感分析,并将数据存储至MongoDB和Postgres数据库。分析结果会被筛选并推送至Slack频道,以便团队实时获取重要信息。此流程有效避免了手动监控社交媒体的繁琐,提高了数据处理效率,支持快速响应市场动态和品牌声誉管理。

社交媒体分析情感分析

每日Product Hunt精选抓取与更新

该工作流每日自动抓取Product Hunt平台上发布的最新产品信息,包括名称、标语、描述及官网链接。它智能处理官网链接的重定向和多余参数,确保数据准确、简洁。最终,整理后的产品详情会被追加或更新至指定的Google Sheets文档中,方便用户进行管理和分析,提升信息获取的效率,适合创业者、投资人和内容创作者等需要跟踪最新产品动态的人群。

Product Hunt抓取自动化更新