Extract & Summarize Yelp Business Review with Bright Data and Google Gemini
该工作流通过自动化抓取Yelp餐厅评论,实现高效的数据提取和摘要生成。利用先进的爬虫技术和AI语言模型,用户可以快速获取并分析目标商户的评价信息,简化了传统手动处理的繁琐过程。支持自定义URL和数据通知,广泛适用于市场调研、用户反馈分析及品牌声誉管理等场景,显著提升了数据应用的效率和用户体验。
流程图

工作流名称
Extract & Summarize Yelp Business Review with Bright Data and Google Gemini
主要功能和亮点
本工作流实现了自动抓取Yelp网站上的餐厅商户评价数据,并通过Google Gemini强大的大语言模型(LLM)对数据进行结构化提取和智能摘要。结合Bright Data的爬取能力,确保数据获取高效且准确。工作流全自动化,支持自定义URL和数据回调通知,极大提升用户体验与数据应用效率。
解决的核心问题
传统手动获取和分析Yelp商户评论费时费力,且难以快速提炼关键信息。本工作流通过自动化数据抓取和AI智能分析,解决了数据采集繁琐、信息杂乱无章、总结困难的核心难题,实现高效快速的评论数据结构化和摘要生成。
应用场景
- 餐饮行业市场调研,快速获取目标城市或餐厅的用户评价和评分情况。
- 数据分析师和产品经理进行用户反馈洞察,辅助决策。
- AI驱动的商业智能平台集成用户点评数据,提升业务监控和客户服务水平。
- 竞品分析及品牌声誉管理。
主要流程步骤
- 手动触发工作流,开始执行数据抓取流程;
- 设置目标Yelp页面URL及对应Bright Data代理区域(zone),定义爬取目标;
- 通过HTTP请求调用Bright Data接口,获取Yelp商户评论的原始数据;
- 使用Google Gemini语言模型,对抓取的评论数据进行结构化提取,输出包括餐厅名称、位置、平均评分、评论数量及详细评论内容等字段;
- 调用Google Gemini的摘要模型,对结构化评论进行智能摘要,生成简洁明了的评价概览;
- 合并结构化数据与摘要结果;
- 通过Webhook通知机制,将最终分析结果推送到指定的URL,方便后续系统接收处理。
涉及的系统或服务
- Bright Data:负责Yelp网站评论数据的代理抓取,保证数据获取的稳定与合规。
- Google Gemini(PaLM API):核心的AI语言模型,用于文本的结构化解析与摘要生成。
- Webhook:用于将处理后的数据推送到第三方系统,实现数据的实时传递与集成。
- n8n自动化平台:整体工作流的搭建与流程管理。
适用人群或使用价值
- 研究餐饮行业用户口碑的市场分析师;
- 需要快速获取并整理大量用户评论的商业智能团队;
- 利用AI技术自动化数据处理的开发者和产品经理;
- 任何希望通过自动化手段提升用户评价数据价值的企业或个人。
此工作流通过结合先进的数据抓取技术和AI语言模型,帮助用户高效捕获、理解和利用Yelp的商户评论信息,极大提升数据处理的自动化和智能化水平。