基于Google Gemini 2.0的图像目标检测与标注工作流

该工作流利用先进的多模态AI技术，实现对图像中目标对象的精准识别与定位。用户可以通过自然语言描述，快速检测特定对象并自动绘制边界框，简化了传统目标检测的繁琐流程。适用于智能图像标注、快速识别、异常监测等多种场景，为开发者和业务分析师提供了灵活、高效的图像处理解决方案。

图像目标检测多模态AI

工作流名称

主要功能和亮点

该工作流利用Google Gemini 2.0的多模态AI能力，实现对指定图像中目标对象的精准识别和定位，通过Prompt（文本提示）方式智能检测图像中特定对象（如兔子），并自动绘制出对应的边界框。亮点在于支持基于自然语言的目标检测请求，提升了图像分析的灵活性和智能化水平。

解决的核心问题

传统图像目标检测通常需要预先训练模型，且缺乏按需定制检测对象的能力。本工作流通过调用Google Gemini 2.0接口，支持用户直接用自然语言描述想要检测的对象，解决了目标检测对象单一、过滤繁琐的问题，同时自动完成坐标归一化与绘制，极大简化了后续处理流程。

应用场景

智能图像内容标注和搜索
图片中的特定对象快速识别与高亮展示
安全监控、物体异常检测
视觉数据分析与报告生成
需要快速按需检测图像中特定元素的业务场景

主要流程步骤

下载测试图像：通过HTTP请求节点获取目标图像资源。
获取图像信息：提取图像宽高，为后续坐标转换做准备。
调用Gemini 2.0目标检测API：发送包含图像数据和文本提示的请求，获取对象边界框坐标。
提取与归一化坐标：解析API返回的标准化坐标，并按图像实际尺寸进行缩放。
绘制边界框：使用“编辑图像”节点在原图上绘制检测到的目标对象边界框。
展示与验证：通过绘制效果直观验证检测效果。

涉及的系统或服务

HTTP Request节点：用于图像获取和调用Google Gemini 2.0 API
Google Gemini 2.0 API：实现基于文本提示的多模态目标检测
Edit Image节点：图像信息提取和边界框绘制
Code节点：对坐标进行数学缩放和转换处理

适用人群或使用价值

AI开发者与数据科学家：快速集成强大图像识别能力，提升视觉数据处理效率
产品经理与业务分析师：基于图像内容实现智能搜索和自动标注
视觉内容管理与监控人员：实现自动化监测和异常识别
任何需要灵活、智能化图像目标检测解决方案的团队或个人

该工作流提供了一个低代码环境下，结合先进多模态AI模型进行图像目标检测与智能标注的实用范本，助力用户轻松构建定制化视觉智能应用。

基于n8n的AI智能股票技术分析代理

该工作流是一个智能股票分析代理，用户通过Telegram发送股票代码和图表样式请求，AI自动生成技术图表并进行深入分析，涵盖K线形态、MACD、RSI等指标，最终以通俗易懂的方式反馈分析结果。支持语音转文字和股票代码存储，便于后续批量分析，整体流程高效自动化，方便用户快速获取专业的股票技术分析报告。

智能股票分析技术图表自动化

AI Telegram Bot with Supabase Memory

该工作流构建了一个智能的Telegram聊天机器人，能够实时接收用户消息并生成智能回复，同时通过Supabase数据库存储用户会话信息，实现上下文记忆和多轮对话的连续性。用户在与机器人互动时，能够享受到个性化和连贯的对话体验，适用于客服、虚拟助理、教育辅导等多个场景，为用户提供更自然、更贴合需求的交互服务。

智能聊天机器人上下文记忆

Github Releases

该工作流自动监控多个GitHub仓库的Release发布，并利用AI模型智能提取和翻译发布内容，分类功能新增、修复项及其他更新，实时通过Slack推送格式化通知。支持定时轮询和错误监控，确保信息及时更新且不重复发送，适合开发团队和产品经理高效跟踪项目版本动态，减少手动检查和信息整理的工作量。

GitHub Release智能提取

Telegram智能助理交互工作流

该工作流基于Telegram平台，提供智能聊天助手功能。通过实时接收用户消息并利用强大的语言模型生成情感丰富的回复，显著提升沟通效率和互动体验。适用于客服、团队助理及信息咨询等场景，实现自动化响应，降低人工成本，满足用户对即时智能辅助的需求。

智能聊天Telegram机器人

Telegram-bot AI Da Nang

该工作流通过集成Telegram聊天机器人与AI语言模型，实现智能会议日程查询。用户可以在Telegram中方便地获取最新活动安排，机器人实时从Google电子表格读取日程数据，并将其转换为结构化Markdown格式，供AI模型处理，快速反馈准确的信息。此外，机器人提供“正在输入”的状态反馈，增强互动体验，极大提升了信息查询的便捷性和效率。

Telegram机器人智能日程

AI智能活动推荐代理工作流

这个工作流利用先进的GPT-4模型与自定义API，提供个性化的活动推荐。通过智能对话，自动识别用户的活动需求，并调用“Bored API”获取多样化建议，帮助用户快速找到合适的闲暇活动。内置的记忆功能增强了对话的连贯性，适合个人用户、智能客服和自动化推荐系统，提升用户体验和生活品质。

智能推荐活动助手

基于AI的智能WordPress文章草稿生成工作流

该工作流通过用户输入关键词、章节数和字数限制，智能生成高质量的WordPress文章草稿。利用OpenAI GPT-4模型生成文章结构和内容，并通过Wikipedia确保信息准确性。同时，它自动生成和上传封面特色图片，简化发布流程，提升内容的逻辑性和SEO表现，适用于内容创作者、营销团队和教育领域，极大地提高写作效率与内容质量。

智能写作WordPress发布

Angie，AI 个人智能助理工作流

该工作流是一款智能个人助理，能够通过 Telegram 监听用户的语音或文本消息，实时进行语义理解和互动。它自动转录语音信息，检索 Gmail 的未读邮件，查询 Google 日历事件，并访问 Baserow 数据库中的任务和联系人，最终为用户提供简明的智能回复。此助手有效整合多种信息渠道，帮助用户高效管理个人信息和日程，提高工作效率与便捷性。

智能助理个人信息管理