LinkedIn Web Scraping with Bright Data MCP Server & Google Gemini

该工作流结合了先进的数据采集服务与AI语言模型，自动化抓取LinkedIn的个人与公司页面信息，并生成高质量的公司故事或个人简介。用户可高效获取结构化数据，避免手动操作的时间浪费，同时支持将抓取结果保存为本地文件或通过Webhook实时推送，便于后续使用。适用于市场调研、招聘、内容创作及数据分析等多种场景，显著提升信息处理效率。

LinkedIn爬取智能内容生成

工作流名称

主要功能和亮点

本工作流集成了Bright Data MCP（Market Client Platform）数据采集服务和Google Gemini大型语言模型，实现对LinkedIn个人和公司页面的自动化数据抓取与智能内容生成。能够高效抓取网页信息，结构化提取并自动生成详细的公司故事或个人简介，输出Markdown格式的高质量文本，同时支持将数据保存为本地文件，方便后续使用。

解决的核心问题

自动化抓取LinkedIn中公开的个人及公司资料，避免手动复制粘贴带来的时间浪费和错误。
利用AI模型对抓取的原始数据进行智能整理和内容生成，提升信息利用效率和表达质量。
支持通过Webhook将抓取和处理结果实时推送，方便集成到其他系统或触发后续自动化操作。

应用场景

市场调研人员需要快速收集目标公司的详细信息和背景故事。
招聘团队自动获取候选人LinkedIn档案数据，辅助筛选和评估。
内容创作者基于公司或个人资料自动生成介绍性文章或博客。
数据分析师进行行业或竞争对手分析时，快速批量采集并格式化数据。

主要流程步骤

手动触发工作流启动。
列出Bright Data MCP支持的所有爬虫工具。
设置目标LinkedIn个人和公司页面的URL。
使用Bright Data MCP客户端分别抓取个人和公司页面数据，结果以Markdown格式返回。
通过代码节点解析抓取结果的JSON内容。
利用LangChain的Information Extractor节点提取结构化的公司详细信息。
调用Google Gemini模型，根据提取信息生成完整的公司故事或个人介绍。
合并并聚合抓取与生成的内容。
通过Webhook发送爬取的LinkedIn公司和个人信息。
将个人和公司信息分别编码为二进制格式并写入本地JSON文件保存。

涉及的系统或服务

Bright Data MCP Server：提供强大的网页爬取和数据采集能力。
Google Gemini（PaLM API）：AI语言模型，支持自然语言生成和信息提取。
n8n自动化平台：作为工作流的基础框架，实现节点间数据流转和逻辑控制。
Webhook.site：用于接收和测试Webhook推送的临时URL。
本地文件系统：保存抓取结果为JSON文件。

适用人群或使用价值

数据科学家、市场分析师、招聘专员等专业人员，通过该工作流可大幅提升LinkedIn数据采集和分析效率。
自动化工程师和技术团队，借助此工作流可快速构建基于AI和爬虫技术的智能信息处理系统。
内容创作者和企业用户，通过自动生成的公司故事或个人简介，提高内容生产质量和速度。
任何需要定期批量抓取和智能处理LinkedIn公开资料以支持业务决策的用户。

该工作流通过整合领先的数据采集与人工智能技术，全面提升LinkedIn信息的获取和应用效率，助力用户实现智能化的数据驱动业务。

国际空间站位置实时记录与存储

该工作流旨在实时获取国际空间站的经纬度和时间戳数据，并将其自动存储到Google BigQuery数据库中。通过定时触发和API调用，避免了手动查询和数据录入的繁琐，确保数据的时效性和完整性。适用于航天科研、教育平台、数据分析等领域，助力实时监测、分析和可视化展示空间站位置。

国际空间站实时定位

Indeed Company Data Scraper & Summarization with Airtable, Bright Data and Google Gemini

该工作流通过自动化抓取Indeed网站的公司数据，利用先进技术突破反爬虫限制，结合数据管理和智能分析工具，实现高效的内容提取与摘要。用户可以快速获取目标企业的招聘信息和动态，解决传统数据采集过程中的繁琐与低效，适用于人力资源、市场调研和AI开发等多个场景，极大提升数据处理效率与决策能力。

数据抓取智能摘要

Save Telegram reply to journal spreadsheet

此工作流自动监听Telegram中的日记回复消息，识别特定格式并将其整理后保存到Google Sheets电子表格中。通过自动抓取和结构化存储用户回复内容，解决了手动整理日记的繁琐问题，提高了效率和准确性，避免信息丢失与重复录入，适合个人及团队进行统一管理与备份。

Telegram自动化电子表格同步

LinkedIn联系人信息自动采集与更新工作流

该工作流实现了LinkedIn联系人信息的自动采集与更新，通过定时触发从Google Sheets读取个人主页URL，利用Prospeo.io API查询详细信息（如姓名、邮箱、职位等），并将数据回写至Google Sheets。此过程有效解决了手动查找联系人信息的繁琐，提升了数据的完整性和准确性，简化了数据维护，适用于销售、市场拓展和招聘团队等需要快速获取联系信息的场景。

LinkedIn采集自动更新

Clockify Backup Template

该工作流自动从 Clockify 获取每月的时间记录报告，并将数据备份到 GitHub 仓库中。支持最近三个月的数据备份，能够智能更新已有文件或创建新文件，确保数据的完整性和准确性。通过定期备份，解决了时间记录数据可能因在线变更而丢失的风险，适合重视数据安全和版本控制的个人与团队，提升管理效率与可靠性。

Clockify备份自动化备份

智能喝水提醒与记录工作流

该工作流通过定时提醒和智能消息交互，提供个性化的喝水提醒，帮助用户养成良好的饮水习惯。用户可通过Slack快速记录饮水量，数据自动同步至Google Sheets，便于集中管理和分析。结合OpenAI生成的健康文案，提升了提醒的专业性和鼓励性，并通过iOS快捷指令实现与健康应用的数据联动，优化了用户的健康管理体验。

智能喝水健康提醒

YouTube Comment Sentiment Analyzer（YouTube评论情感分析器）

该工作流自动从Google表格读取YouTube视频链接，实时抓取评论数据，并利用AI模型对评论进行情感分析，分类为正面、中性或负面。分析结果会更新回Google表格，确保数据管理的统一性与时效性。通过支持分页获取评论和灵活的更新频率，极大提高了内容创作者和品牌团队对观众反馈的洞察能力，助力优化内容策略和市场应对。

YouTube评论情感分析

手动触发数据键名重命名工作流

该工作流通过手动触发功能，将一组初始数据中的指定键名进行自动重命名，帮助用户快速实现数据字段的转换和标准化。适合在开发调试、数据预处理等场景中使用，能有效解决字段命名不统一的问题，减少手动修改的繁琐，提高数据整理的效率和准确性，便于后续流程的使用。

数据重命名手动触发