Create Animated Stories using GPT-4o-mini, Midjourney, Kling and Creatomate API

该工作流实现了从文本故事创作到动画视频生成的全自动化过程。用户只需输入基本参数,系统便会通过智能生成故事提示、插画和动态视频,最终合成出完整的动画故事视频。该流程显著降低了传统动画制作的复杂性与时间成本,适用于儿童故事、品牌宣传片等多媒体内容的快速生成,帮助内容创作者和教育工作者高效产出高质量的动画素材。

Tags

动画制作自动化创作

工作流名称

Create Animated Stories using GPT-4o-mini, Midjourney, Kling and Creatomate API

主要功能和亮点

本工作流实现了从文本故事创作到动画视频生成的全自动流程。通过GPT-4o-mini智能生成故事场景提示,结合Midjourney进行多张高质量插画创作,再利用Kling API将静态图片转化为动态视频,最后通过Creatomate API进行视频合成,输出完整的动画故事视频。流程自动化程度高,支持多轮异步任务状态检测与等待,确保生成内容的质量和完整性。

解决的核心问题

传统动画制作流程复杂且耗时,本工作流通过集成多种AI服务,实现故事创意、图像生成、视频制作和合成的自动化,显著降低了内容制作门槛和时间成本,适合快速生成儿童故事、品牌宣传片等多媒体内容。

应用场景

  • 儿童故事动画制作
  • 品牌营销视频快速生成
  • 社交媒体内容创作
  • 教育和培训视频素材自动化生产

主要流程步骤

  1. 基本参数设置:用户输入故事角色、画面风格及情境关键词。
  2. 故事提示生成:通过GPT-4o-mini生成分段故事文本及对应图像提示。
  3. 插画生成:调用Midjourney API分别生成三张故事关键场景的插画。
  4. 插画状态监控与获取:轮询检查图片生成状态,确保图片完成后获取临时URL。
  5. 视频生成:基于三张插画调用Kling API生成三段动态视频。
  6. 视频状态监控与获取:轮询检查视频生成状态,确保视频生成完成。
  7. 视频合成:利用Creatomate API将三段视频合成一部完整的动画故事视频,嵌入故事标题文本。
  8. 最终输出:获取合成后视频的URL,实现动画故事的全流程自动化生成。

涉及的系统或服务

  • GPT-4o-mini:生成故事文本和图像描述提示
  • Midjourney(通过piapi.ai接口):绘制故事插画
  • Kling(通过piapi.ai接口):将静态插画生成动态视频
  • Creatomate:视频模板合成与最终视频生成
  • n8n:工作流编排与任务状态管理

适用人群或使用价值

  • 内容创作者与动画制作人员,快速生成高质量动画故事素材
  • 营销和品牌团队,提升视频内容制作效率
  • 教育工作者,自动化生成教学动画
  • AI爱好者和开发者,探索多AI工具集成的自动化创作流程

该工作流通过深度整合多种AI生成服务,极大地简化了从故事构思到动画成品的制作流程,帮助用户高效产出富有创意且专业的动画内容。

推荐模板

Dsp agent

该工作流通过Telegram消息触发,提供智能的语音转文本功能,结合先进的语言模型进行信号处理学习辅导。它能够解答理论问题、辅助计算,并查询维基百科,提供个性化的学习体验。同时,它记录用户学习进度,整合Airtable数据库,支持内容创作和邮件管理,帮助学生和专业人士高效解决学习中的难题,提升理解能力和学习效果。

智能问答语音转文本

Image-Based Data Extraction API using Gemini AI

该工作流通过Webhook接口,实现对图片中信息的智能提取。用户只需提供图片URL,即可自动下载并转换为Base64格式,利用Google Gemini AI进行高效的文字识别。提取的内容可灵活配置,最终以结构化JSON格式输出,方便后续系统集成。该方案简化了传统的图像文字提取流程,提高了准确性和自动化水平,适用于各类证件、财务单据及表单的数据处理。

图像文字识别数据提取API

法语文本语音合成及英译音频生成工作流

该工作流将法语文本自动转换为法语语音,并将生成的音频转录为文本,随后翻译成英文,再生成英文语音文件。结合高质量的文本转语音与语音转文本服务,自动化处理多语言内容,提升了语言学习、内容制作和跨国沟通的效率,适用于教育、创作和翻译等多种场景。

语音合成多语种翻译

Vector DB Loader from Google Drive

该工作流旨在自动从Google Drive中下载并处理PDF、纯文本和JSON文件,通过OpenAI的文本嵌入模型将其转化为向量数据,并存储到Postgres数据库中的PGVector向量库。此过程实现了文档的高效管理与检索,同时自动归档已处理文件,提升了工作效率和自动化程度,适合数据工程师、知识管理团队及研究机构使用。

向量化管理Google Drive自动化

My workflow 6

该工作流通过Slack的Slash命令实现智能AI聊天机器人,能够接收用户请求并调用OpenAI GPT-4o-mini模型生成实时回复。支持多条命令的分流处理,自动化响应减少人工负担,同时结合Webhook和LangChain技术提升对话的上下文理解。适用于企业内部沟通、客户支持等场景,旨在提高沟通效率并提供灵活的智能交互体验。

智能聊天机器人Slack集成

Travel Planning Agent with Couchbase Vector Search, Gemini 2.0 Flash and OpenAI

该工作流是一个智能旅行规划助手,通过结合大型语言模型和向量搜索技术,能够快速为用户提供个性化的旅行推荐。用户可以通过聊天与AI代理互动,基于兴趣点数据获取精准的旅游建议。工作流支持批量数据插入和高效检索,解决了传统旅行规划中信息分散和查询效率低的问题,适用于旅游服务平台、旅行社及相关应用场景。

智能旅行向量搜索

AI Agent for Realtime Insights on Meetings(实时会议智能助理)

该工作流通过智能助理自动加入在线会议,实现实时语音转录,精准捕捉和整理会议对话。结合AI技术,能够基于关键词进行智能分析和笔记生成,并将结构化数据存储,方便后续检索。此解决方案显著提升会议记录的效率和准确性,适用于远程团队、项目管理及各行业的会议纪要自动生成,助力团队协作和信息透明化。

智能会议实时转录

Image Generation API

该工作流通过Webhook接口实时接收用户的文本提示,并利用OpenAI的图像生成API生成对应的图片。用户只需将带提示词的URL粘贴到浏览器,即可快速获取AI生成的图像,整个过程自动化且响应迅速。它简化了传统图像生成的复杂流程,让用户无需编写代码,轻松实现创作,适用于设计师、内容创作者和开发者等多种场景。

AI图像生成Webhook接口