Speech Support Workflow（演讲辅助工作流）

该演讲辅助工作流旨在通过Telegram即时接收用户的演讲稿草稿，利用先进的AI技术进行语音转文字和内容分析，提供反馈建议和演讲稿生成。支持多轮互动并动态调整系统提示，以满足不同阶段的需求。工作流还自动管理记忆，确保反馈精准，实现格式化文本输出，解决演讲准备中的专业反馈不足、语音转化困难及内容传递不畅等问题，提升用户的演讲质量与效率。

演讲辅助语音转文字

工作流名称

主要功能和亮点

该工作流通过Telegram即时接收用户的文字或语音演讲稿草稿，利用先进的AI模型（Google Gemini和OpenAI）进行语音转文字、内容分析、反馈建议及演讲稿生成。支持多轮互动，动态调整系统提示以满足不同演讲准备阶段的需求。自动清理AI记忆，避免上下文干扰，确保反馈精准。输出文本经过格式化处理和长度切分，完美适配Telegram消息限制，实现流畅对话体验。

解决的核心问题

解决演讲准备过程中缺乏专业反馈和指导的问题
语音内容难以转化为可编辑文本的痛点
演讲稿结构、内容和表达效果难以自我把控和优化
演讲稿内容过长难以在即时通讯工具中顺畅传递的问题

应用场景

公共演讲者、培训师、教育者和学生的演讲准备和提升
需要快速迭代修改演讲稿的职场人士
希望通过AI辅助优化表达和内容结构的内容创作者
远程协作环境中基于Telegram沟通的演讲稿制作

主要流程步骤

接收消息：通过Telegram触发节点接收用户发送的文字或语音消息
消息预处理：判断消息类型，若为语音则下载并调用OpenAI进行语音转写
内容分析与路由：根据文本内容路由到不同的系统提示（新演讲开始、生成演讲稿、反馈演讲稿）
AI交互处理：调用Google Gemini模型和LangChain AI Agent进行反馈、演讲稿生成或辅助准备
记忆管理：存储和清理会话记忆，保证上下文连贯且避免信息干扰
输出处理：移除文本中可能影响Telegram格式的字符，并将长文本分割为多个消息块
回复用户：将处理后的文本分段通过Telegram消息回复用户，实现持续互动

涉及的系统或服务

Telegram（消息收发和文件下载）
OpenAI（语音转写服务）
Google Gemini（PaLM API，用于生成自然语言回复）
n8n内置节点（流程控制、条件判断、代码处理、记忆管理）
LangChain AI Agent（多模态与上下文管理）

适用人群或使用价值

需要演讲稿撰写、修改和演练辅助的个人和团队
希望通过AI提升演讲内容质量和表达效果的演讲者
利用Telegram进行远程协作和即时反馈的用户
追求高效、多轮、智能化演讲准备流程的职场人士和内容创作者

该工作流将复杂的演讲准备过程智能化、流程化，结合语音识别与最新AI语言模型，打造了一个贴心的“AI演讲教练”，帮助用户轻松梳理思路、优化内容、提升表达，显著提高演讲质量和效率。

3D Figurine Orthographic Views with Midjourney and GPT-4o-Image API

该工作流通过整合图像生成和多模态模型，实现将文本描述自动转化为高质量3D卡通人物形象，并生成正、侧、背三个视角的展示图。这一流程简化了传统角色设计的复杂性，显著提升设计效率，降低了专业门槛，适用于IP形象设计、游戏角色开发及产品原型制作等多个场景，助力创意工作室快速实现视觉化构思。

3D角色生成多视角渲染

基于Google Gemini 2.0的提示式对象检测与图像标注演示工作流

该工作流利用Google Gemini 2.0多模态AI模型，实现基于文本提示的图像对象检测与标注。通过自动识别特定对象（如兔子）并绘制精准的边界框，提升了图像分析和标注的效率。它解决了传统模型灵活性不足的问题，支持动态定位不同语义目标，并确保检测结果与原图尺寸匹配，适用于智能图像分析、异常行为检测、电子商务自动标注等场景。

对象检测图像标注

⚡📽️ Ultimate AI-Powered Chatbot for YouTube Summarization & Analysis

该工作流通过AI技术实现对YouTube视频的自动转录、信息获取与内容分析。用户可以通过聊天界面与系统互动，快速提问并获得视频摘要与重点解析，节省观看时间。集成了YouTube数据API与开源工具，结合强大的语言模型，提供精准的内容输出。适用于教育、内容创作与市场分析等场景，提升了信息获取的便捷性和效率。

视频转录内容分析

Ultimate Personal Assistant（终极个人助理）

该工作流旨在提供全面的个人助理服务，自动处理用户的邮件、日历、联系人、内容创作及信息搜索等请求。通过智能代理，用户可以通过文字或语音与系统交互，实现多模态操作。集成了先进的自然语言处理技术，确保高效识别和路由请求，简化日常事务管理，提升工作效率与响应速度，适用于职场人士及内容创作者，助力智能化工作体验。

智能助理多模态交互

AI驱动的公司信息自动化调研与数据丰富工作流

该工作流通过先进的AI模型与多种数据抓取工具，实现对公司信息的自动化调研和结构化输出。用户可从公司名称或域名出发，快速获取包括LinkedIn链接、市场定位和价格计划等多维度信息。支持定时和手动触发，极大提高调研效率，降低人工成本，确保数据准确且易于管理，适合市场调研、销售、产品分析等多种场景，助力业务决策与市场洞察。

公司调研自动化采集

AI-Powered WhatsApp Chatbot for Text, Voice, Images & PDFs

该工作流利用WhatsApp平台和OpenAI的AI技术，创建了一个智能聊天机器人，支持文本、语音、图片和PDF文档的自动识别与回复。通过分析不同类型的消息，机器人能够快速理解用户需求，提供精准反馈，提升客服响应速度和信息获取效率，满足多样化的沟通场景，极大增强了用户体验。

多模态AIWhatsApp机器人

Text automations using Apple Shortcuts（基于Apple快捷指令的文本自动化工作流）

这个工作流利用Apple快捷指令和OpenAI模型，实现对选中文本的智能自动化处理。用户可以快速进行翻译、语法校正、文本缩短或扩展等多种操作，显著提升文本编辑的效率和质量。通过Webhook的无缝集成，操作便捷且高效，适合内容创作者、编辑和需要跨语言沟通的用户，满足移动办公和实时文本处理的需求。

文本自动化Apple快捷指令

🧠 Give Your AI Agent Chatbot Long Term Memory Tools Router

该工作流为AI聊天机器人提供长期记忆管理功能，能够持久保存和调用历史对话及关键信息。通过动态工具路由器，自动根据任务指令调用不同工具，实现高效的任务分发。此外，结合OpenAI GPT-4o-mini模型，提升了上下文理解和智能应答能力，并支持通过Telegram和Gmail等渠道进行多渠道通知，显著增强了信息传达效率，提供个性化的用户体验。

长期记忆工具路由器