Hacker News 历年头条洞察自动化工作流
该工作流自动抓取Hacker News历年的头条新闻,整理同一日期的重点新闻标题,并利用大语言模型进行智能分类与分析。最终生成结构化的Markdown格式洞察报告,通过Telegram频道实时推送给用户。此流程高效解决了手动整理新闻的重复工作,提升了信息获取的效率和及时性,适用于科技研究、新闻回顾及数据分析等多种场景。
流程图

工作流名称
Hacker News 历年头条洞察自动化工作流
主要功能和亮点
该工作流定时抓取 Hacker News 当日历年头条新闻,自动提取并聚合多年来同一日期的重点新闻标题,利用 Google Gemini 语言模型智能分类与分析,最终生成结构化的 Markdown 格式洞察报告,并通过 Telegram 频道实时推送给用户。
解决的核心问题
- 自动化跨年份新闻数据抓取与整理,避免手动重复操作
- 利用大语言模型智能识别并分类海量新闻信息,挖掘核心主题与趋势
- 实现多平台数据流转及自动推送,提升信息获取效率和及时性
应用场景
- 科技行业研究人员追踪技术发展趋势
- 新闻采编人员快速回顾历史热点事件及演变
- 数据分析师进行时间序列新闻主题分析
- 社交媒体运营通过定期高质量内容推送增强用户粘性
主要流程步骤
- Schedule Trigger:每日21点触发工作流启动
- CreateYearsList:根据当前日期生成自2007年起至今的对应日期列表
- CleanUpYearList & SplitOutYearList:整理并拆分日期列表,准备逐日抓取
- GetFrontPage:向 Hacker News 前端页面发起请求,获取指定日期的头条HTML
- ExtractDetails:解析HTML,抓取新闻标题及对应日期
- GetHeadlines & GetDate:整理标题和日期信息
- MergeHeadlinesDate & SingleJson:合并多日期数据为统一JSON结构
- Basic LLM Chain(集成 Google Gemini Chat Model):调用大语言模型,基于输入JSON识别重点头条,按主题分类并生成Markdown格式分析报告
- Telegram:将生成的报告通过Telegram频道自动推送给订阅者
涉及的系统或服务
- Hacker News(数据源)
- Google Gemini(PaLM)语言模型(智能分析与文本生成)
- Telegram(内容分发推送)
- n8n平台(工作流自动化编排)
适用人群或使用价值
- 技术趋势分析师和行业观察者,帮助他们快速把握科技新闻演变脉络
- 媒体与内容运营人员,高效获取优质历史新闻内容,丰富内容创作素材
- 数据科学家和研究人员,支持时间序列新闻数据分析与洞察挖掘
- 任何关注科技新闻及其历史发展动态的个人或团队,提升信息洞察力和决策效率
此工作流通过高度自动化的数据抓取、智能内容分析与多渠道推送,实现了跨年度新闻主题的系统化洞察,是科技信息内容管理与传播的有力工具。