Hacker News 历年头条洞察自动化工作流

该工作流自动抓取Hacker News历年的头条新闻,整理同一日期的重点新闻标题,并利用大语言模型进行智能分类与分析。最终生成结构化的Markdown格式洞察报告,通过Telegram频道实时推送给用户。此流程高效解决了手动整理新闻的重复工作,提升了信息获取的效率和及时性,适用于科技研究、新闻回顾及数据分析等多种场景。

流程图
Hacker News 历年头条洞察自动化工作流 工作流程图

工作流名称

Hacker News 历年头条洞察自动化工作流

主要功能和亮点

该工作流定时抓取 Hacker News 当日历年头条新闻,自动提取并聚合多年来同一日期的重点新闻标题,利用 Google Gemini 语言模型智能分类与分析,最终生成结构化的 Markdown 格式洞察报告,并通过 Telegram 频道实时推送给用户。

解决的核心问题

  • 自动化跨年份新闻数据抓取与整理,避免手动重复操作
  • 利用大语言模型智能识别并分类海量新闻信息,挖掘核心主题与趋势
  • 实现多平台数据流转及自动推送,提升信息获取效率和及时性

应用场景

  • 科技行业研究人员追踪技术发展趋势
  • 新闻采编人员快速回顾历史热点事件及演变
  • 数据分析师进行时间序列新闻主题分析
  • 社交媒体运营通过定期高质量内容推送增强用户粘性

主要流程步骤

  1. Schedule Trigger:每日21点触发工作流启动
  2. CreateYearsList:根据当前日期生成自2007年起至今的对应日期列表
  3. CleanUpYearList & SplitOutYearList:整理并拆分日期列表,准备逐日抓取
  4. GetFrontPage:向 Hacker News 前端页面发起请求,获取指定日期的头条HTML
  5. ExtractDetails:解析HTML,抓取新闻标题及对应日期
  6. GetHeadlines & GetDate:整理标题和日期信息
  7. MergeHeadlinesDate & SingleJson:合并多日期数据为统一JSON结构
  8. Basic LLM Chain(集成 Google Gemini Chat Model):调用大语言模型,基于输入JSON识别重点头条,按主题分类并生成Markdown格式分析报告
  9. Telegram:将生成的报告通过Telegram频道自动推送给订阅者

涉及的系统或服务

  • Hacker News(数据源)
  • Google Gemini(PaLM)语言模型(智能分析与文本生成)
  • Telegram(内容分发推送)
  • n8n平台(工作流自动化编排)

适用人群或使用价值

  • 技术趋势分析师和行业观察者,帮助他们快速把握科技新闻演变脉络
  • 媒体与内容运营人员,高效获取优质历史新闻内容,丰富内容创作素材
  • 数据科学家和研究人员,支持时间序列新闻数据分析与洞察挖掘
  • 任何关注科技新闻及其历史发展动态的个人或团队,提升信息洞察力和决策效率

此工作流通过高度自动化的数据抓取、智能内容分析与多渠道推送,实现了跨年度新闻主题的系统化洞察,是科技信息内容管理与传播的有力工具。