Scrape Trustpilot Reviews with DeepSeek, Analyze Sentiment with OpenAI
该工作流能够自动从Trustpilot网站爬取指定公司的用户评论,提取评论的关键信息并进行情感分析。通过DeepSeek模型,精准获取评论的作者、评分、日期等多维信息,再利用OpenAI对评论情绪进行分类,实现评论数据的自动收集和智能分析,最终将数据同步更新到Google Sheets,为品牌管理、市场调研和客户服务提供有力支持。
Tags
工作流名称
Scrape Trustpilot Reviews with DeepSeek, Analyze Sentiment with OpenAI
主要功能和亮点
该工作流自动从Trustpilot网站爬取指定公司的用户评论,利用DeepSeek模型精准提取评论的关键信息(如作者、评分、日期、标题、内容、用户国家及用户发布的总评论数),并通过OpenAI进行情感分析,判断评论情绪为积极、中性或消极。最终将结构化的评论数据和情感分类结果同步更新到Google Sheets,实现评论数据的自动化收集与智能分析。
解决的核心问题
- 自动收集大量Trustpilot的用户评论,避免人工逐条查找和复制粘贴的繁琐。
- 精准提取评论的多维信息,确保数据完整性和准确性。
- 通过AI情感分析快速洞察用户反馈的情绪倾向,帮助企业了解客户满意度和潜在问题。
- 实现数据的实时更新和存储,方便后续统计分析和业务决策。
应用场景
- 品牌声誉管理:自动监控和分析客户评价,及时发现负面反馈。
- 市场调研:收集竞品或自家产品的用户评价数据,辅助产品优化。
- 客户服务:根据情感分类优先处理负面评论,提高客户满意度。
- 数据汇报:为管理层提供结构化、动态更新的客户反馈数据报表。
主要流程步骤
- 手动触发工作流启动。
- 设置目标公司名称和爬取的最大评论页数。
- 通过HTTP请求分页抓取Trustpilot指定公司的评论页面。
- 使用HTML节点提取评论链接列表。
- 对评论链接进行拆分和限制数量控制。
- 逐条抓取单条评论的详细HTML内容。
- 调用DeepSeek模型提取评论作者、评分、日期、标题、正文、用户国家及评论数量等信息。
- 利用OpenAI模型对评论正文进行情感分析,分类为积极、中性或消极。
- 查询Google Sheets判断评论是否已存在,防止重复保存。
- 将新评论数据及情感结果追加或更新到Google Sheets中。
涉及的系统或服务
- Trustpilot(评论数据源)
- DeepSeek(信息提取AI模型)
- OpenAI(情感分析AI模型)
- Google Sheets(数据存储和管理)
- n8n自动化平台(工作流编排)
适用人群或使用价值
- 市场营销人员和品牌管理者:轻松掌握客户真实反馈,优化品牌形象。
- 数据分析师和产品经理:获取结构化用户评价数据,辅助产品决策。
- 客户服务团队:快速识别负面评论,提升客户体验。
- 自动化爱好者和技术开发者:实现复杂爬取+AI分析的自动化流程,节省人力成本。
此工作流结合了网页爬取与先进的AI自然语言处理技术,能够高效、智能地管理和分析Trustpilot用户评价,是企业数据驱动运营的重要利器。
Extract & Summarize Bing Copilot Search Results with Gemini AI and Bright Data
该工作流通过Bright Data的API自动抓取Bing Copilot的搜索结果,并利用Google Gemini AI模型进行数据的结构化提取和内容摘要生成。它解决了传统搜索结果数据杂乱的问题,提升了信息利用效率。用户可以快速获取关键词相关的搜索信息,帮助市场调研、竞争情报分析和内容创作。最终,处理结果通过Webhook推送,方便后续集成与自动化处理。
Brand Content Extract, Summarize & Sentiment Analysis with Bright Data
该工作流利用先进的网络抓取和人工智能技术,实现对指定品牌网页内容的自动抓取、文本提取、摘要生成及情感分析。通过突破网页反爬限制,实时获取高质量内容,系统化地分析消费者对品牌的态度,并提供清晰的文本摘要和情感分类。适用于品牌监测、市场调研及用户反馈处理,帮助相关人员快速获取深度洞察,优化决策和策略。
Remove PII from CSV Files(CSV 文件个人信息自动脱敏)
该工作流自动监控 Google Drive 文件夹中的新 CSV 文件,一旦检测到新文件即启动流程。它利用 OpenAI 智能识别个人身份信息(PII)列,并自动删除这些敏感数据,生成脱敏后的文件并重新上传到指定文件夹。整个过程高效、智能且无需人工干预,有效降低了数据泄露风险,适合需要批量处理隐私数据的企业和团队。
Google Page Entity Extraction Template
该工作流利用谷歌自然语言API,自动提取任意网页中的命名实体,如人物、组织和地点,实现信息的结构化分析。用户通过Webhook提交网页URL,系统自动抓取内容并进行实体识别,返回详细的实体信息及其重要性评分。此工具特别适用于媒体监控、市场调研和数据集成等场景,极大地提高了信息处理的效率和准确性,帮助用户快速获取关键数据。
Extract text from PDF and image using Vertex AI (Gemini) into CSV
该工作流能够自动从Google Drive指定文件夹中新上传的PDF文件和图片中提取文本,通过Google Vertex AI和Openrouter AI进行智能识别与分析。提取后的交易数据将被转化为带有分类信息的CSV文件,并自动上传回Google Drive,从而简化了手动数据录入和分类的过程,提升了数据处理的效率和准确性,适用于财务管理和数据分析等多种场景。
Calculate the Centroid of a Set of Vectors(向量集合质心计算)
该工作流能够自动接收并处理多个向量,确保输入数据的维度一致性,计算出这些向量的质心,即各维度的平均值,并将结果以友好的格式返回。它有效解决了多维数据处理中的常见问题,适用于数据分析、机器学习及地理信息系统等领域,提升了数据处理的自动化和准确性。
AI Agent 与 Supabase/PostgreSQL 数据库对话助手
该工作流构建了一款智能对话助手,结合自然语言处理与数据库管理,让用户无需掌握 SQL 技能即可通过自然语言查询与分析数据。它能够动态生成 SQL 查询、获取数据库表结构、处理 JSON 数据,并提供清晰易懂的查询结果反馈。此工具极大降低了数据库操作的门槛,适用于企业内部数据分析、客户服务、产品支持以及教育培训等场景,提升了数据查询的便利性和效率。
Spot Workplace Discrimination Patterns with AI
该工作流通过自动化抓取和分析Glassdoor上的员工评价数据,利用AI技术深入解析公司评分及不同人口群体的职场体验差异,计算统计学指标并生成可视化图表。它帮助HR和管理层量化职场歧视现象,支持公平改进措施,推动组织文化改善和包容性评估,实现数据驱动的多元化、公平与包容项目的有效实施。