AI智能图像自动生成标题与文字水印

该工作流通过集成先进的多模态视觉语言模型，实现图像的自动化标题和描述生成，并将其作为水印叠加到图片上。用户只需导入图片，系统便能自动调整尺寸、生成文字并确保其美观展示，极大降低了人工撰写的时间成本。该功能特别适用于媒体、电商和社交媒体等领域，帮助内容创作者和设计师提升工作效率与视觉效果。

AI图像标题文字水印

工作流名称

AI智能图像自动生成标题与文字水印

主要功能和亮点

该工作流通过集成Google Gemini多模态视觉语言模型，自动为输入的图像生成精准且富有创意的标题和描述文字，并将生成的文字以水印形式叠加到图片底部。整个过程自动化完成，无需人工干预，且支持图像尺寸调整和文字位置智能计算，确保文字清晰且美观地呈现在图片上。

解决的核心问题

自动化为图片生成符合语境的标题与描述，减少人工撰写文字的时间成本。
实现图像与文字的无缝合成，方便图文发布、版权标注和社交媒体分享。
利用先进的多模态AI模型，提升图像理解和文字生成的准确性与创造力。

应用场景

媒体与出版行业，自动为图片生成说明文字，提升内容生产效率。
电商平台，为商品图片自动生成吸引人的标题和描述，增强用户体验。
社交媒体运营，快速制作带有水印和说明的视觉内容，增强品牌传播力。
摄影师或设计师，为作品自动添加版权信息或创意说明。

主要流程步骤

导入图片：通过HTTP请求节点从Pexels等免费图库下载图片，或替换为其他触发方式导入图片。
图像预处理：调整图片尺寸（512x512），适配AI模型输入要求。
调用Google Gemini视觉语言模型：将处理后的图片发送给Google Gemini模型，生成图像的标题和描述文本。
结构化解析生成内容：利用结构化输出解析器对AI返回文本进行格式化处理。
计算文字位置：通过自定义代码节点计算文字框的位置和大小，确保文字在图片底部合适位置显示。
文字叠加合成：使用编辑图像节点，将生成的标题和描述以半透明背景和白色字体叠加到图片上。
输出结果：生成带有AI智能文字水印的图片，适合发布和二次使用。

涉及的系统或服务

Google Gemini Chat Model（Google PaLM API）——多模态视觉语言模型
HTTP Request节点——图片资源获取
Edit Image节点——图像编辑与文字叠加
Code节点——文字位置和尺寸计算
Langchain节点系列——实现AI模型调用及输出解析

适用人群或使用价值

内容创作者、编辑和媒体工作者，快速生成图像说明文字。
电商运营人员，提升商品图片的文案质量与视觉表现。
社交媒体经理，自动制作带有吸引力文字的图片内容。
设计师和摄影师，轻松为作品添加版权或描述信息。
自动化爱好者和开发者，学习和应用多模态AI模型在图文处理上的实践案例。

该工作流充分利用n8n的低代码自动化能力，结合尖端AI技术，帮助用户高效完成图像文字生成与合成任务，极大提升工作效率与内容质量。

🤖 Telegram Messaging Agent for Text/Audio/Images

该工作流实现了基于Telegram的智能消息处理，支持文本、语音和图片信息的自动接收与分析。通过Webhook技术，系统能够实时获取消息，并利用OpenAI GPT-4模型进行语音转录、文本分类和图像内容分析，从而高效区分任务指令与普通聊天，快速生成个性化响应。此工作流适用于客服、工作助手及教育领域，显著提升了信息处理的自动化和智能化水平。

Telegram机器人多模态消息处理

Coinmarketcap Price Agent

该工作流通过Telegram接收用户的加密货币名称，并利用CoinMarketCap的API实时查询最新价格。结合OpenAI的智能语言处理技术，能够理解多样化提问并进行对话管理，实现上下文记忆，提升交互效果。用户无需访问多个网站，便可快速获得权威价格信息，适合投资者、金融分析师和区块链社区，极大简化了查询流程并提高了信息获取效率。

加密货币价格智能问答

CallForge - The AI Gong Sales Call Processor

CallForge 是一款智能工作流，专注于自动提取和分析 Gong 销售通话录音。它通过整合产品和竞争对手数据，清理通话文本，并利用 AI 技术生成结构化分析结果，显著提高销售数据处理的效率与准确性。该工作流支持销售团队快速获取关键信息，优化策略，同时满足产品和市场分析、客户服务等多部门需求，推动企业业务增长。

销售通话分析自动化工作流

Load Prompts from Github Repo and auto populate n8n expressions

该工作流从指定的GitHub仓库自动加载文本提示，智能识别并替换变量占位符，确保内容完整无误。通过变量校验机制，若发现缺失信息，会自动终止并反馈错误，保障处理的准确性。处理后的完整提示可直接传入AI代理进行智能文本生成或分析，适用于营销、内容创作及自动化开发等多个场景，有效提升工作效率和内容个性化。

GitHub集成智能变量替换

OpenSea NFT Agent Tool

OpenSea NFT Agent Tool 是一款智能助手，利用 AI 技术集成多种接口，快速获取与 NFT 相关的用户资料、收藏、合约详情及元数据等信息。该工具能够自动化处理复杂查询，确保请求格式正确，提升用户体验。适合 NFT 收藏者、投资者及开发者，帮助他们实时了解市场动态、分析资产表现，并简化数据获取流程，实现高效的数字资产管理与决策支持。

NFT数据智能查询

CallForge - AI Gong销售通话处理器

该工作流利用AI技术自动处理和分析销售通话，提取关键信息并生成市场洞察、重复话题及可执行建议。通过与Notion数据库集成，实现数据的结构化存储与共享，支持销售与市场团队的高效协作。同时，设置智能条件判断和节流机制，确保数据处理的准确性与稳定性，帮助企业提升信息利用率和业务竞争力。

销售通话分析Notion集成

Extract personal data with a self-hosted LLM Mistral NeMo

该工作流利用自托管的大语言模型Mistral NeMo，通过聊天消息触发，智能提取用户的个人信息数据。它结合了结构化输出解析和自动修正机制，确保提取的数据符合JSON格式规范，提升数据的准确性和可靠性。适合需要高效、准确处理个人信息的企业与开发者，尤其注重数据隐私与自托管解决方案的团队，显著提高客户信息采集的自动化水平，减少人工干预。

自托管LLM个人信息提取

🎥 Gemini AI Video Analysis

该工作流利用Google的Gemini 2.0 Flash AI模型，智能分析视频内容。用户只需输入视频URL，即可自动下载并上传至Gemini平台，获取详细的视觉描述，包括关键元素、动作和品牌信息。这一自动化过程显著提高了视频处理的效率和准确性，解决了传统人工分析耗时的问题，适用于内容审核、媒体管理和市场营销等多个场景，提升了视频的可访问性和业务价值。

视频分析智能解析