coze 奇思妙想绘本智能体
目录
智能体介绍
本文将为您详细介绍一款专为儿童设计的绘本制作智能体。用户只需提供一个主题或灵感,该智能体便能够基于此生成一个完整的绘本故事,并配以精美的插图,最终输出一本包含五个页面的绘本。
整个创作过程首先由一位“儿童文学作家”大模型生成约 1500 字的绘本故事内容,这包括五个页面的情节划分。在完成故事概要后,系统会通知用户,并由一位“AI 会话提示词专家”根据故事内容准备五页绘本的绘图提示词。随后,工作流将调用绘图模块,每次处理两页的提示词,逐步完成整本绘本的绘制。
智能体设置
这款智能体直接面向用户,其人设与回复逻辑非常简洁明了——无论用户提出何种问题,都会直接触发story_book
工作流。
-
人设与回复逻辑:
不论用户提出什么问题,都直接调用`story_book`工作流。
-
工作流:
story_book
工作流即中间名为story_book_1_927
的工作流。接下来我们将深入探讨这个工作流的具体操作。 -
开场白:
- 开场白文案
- 开场白预置问题
-
背景图片
-
用户输入方式:默认为打字输入
整体创作工作流
开始
开始节点定义了一个输入变量user_q
。值得注意的是,coze 智能体添加工作流后,无需手动绑定输入变量user_q
,coze 会自动完成这一操作。因此,工作流的开始节点输入变量user_q
实际上就是用户的输入问题。
告知开始主题创作
由于 coze 支持并行流程,当开始节点接收到主题后,除了立即进入【儿童文学作家故事创作】节点外,还会同步进入告知节点,及时通知用户故事创作已经开始。
儿童文学作家故事创作
在此节点,系统调用大模型【豆包工具调用】,模拟一位儿童文学作家,基于用户提供的主题生成绘本故事。输出的内容和格式大致如下:
{
"story_title":"你创作故事的标题",
"story_summy":"你创作故事的概要,300 字左右",
"story_hero":"你创作的故事主角的外貌描述,用作制作绘本配图时的提示词",
"pages":[{
"page_1":"你创作故事的开头部分",
"page_2":"你创作故事的发展部分",
"page_3":"你创作故事的高潮部分",
"page_4":"你创作故事的解决部分",
"page_5":"你创作故事的结尾部分"
}]
}
告知故事概要
同样地,在故事创作完成后,系统不仅会进入【AI 插画制作提示词专家】节点,还会同步进入告知节点,及时向用户展示已创作的故事概要,让用户提前了解故事内容。
AI 插画制作提示词专家
这个节点的功能可能稍显复杂。它调用了大模型【豆包工具调用】,并通过批处理选择上一节点【儿童文学作家故事创作】的输出变量pages
。批处理的设置意味着系统将遍历pages
,每一页都会循环调用大模型一次。
输入变量story
绑定了每次遍历pages
的具体page_x
数据,而变量story_hero
则绑定了上一节点的story_hero
变量。因此,按照上一节点的输出,我们会遍历pages
,循环五次,分别将page_1
至page_5
作为本节点的story
变量,同时将story_hero
变量作为本节点的story_hero
变量。经过五次调用大模型后,系统将输出插画制作 AI 提示词,输出结构如下:
{
"pro_1":"故事开头部分的提示词",
"pro_2":"故事发展部分的提示词",
"pro_3":"故事高潮部分的提示词",
"pro_4":"故事解决部分的提示词",
"pro_5":"故事结尾部分的提示词"
}
当然,coze 允许我们在本节点的输出中定义 JSON 数据结构,确保提示词要求的输出格式一致,方便后续节点直接使用本节点的输出变量。
告知正在插画制作
完成 AI 插画制作提示词专家节点后,系统会马上进入告知节点,及时通知用户插画制作正在进行中。
12 页故事插画制作
这个节点调用了自定义工作流(即从资源库引用)。我们只需了解该节点的输入与输出要求即可:
- 输入:第一页
page_1
文字内容与对应插画制作 AI 提示词,以及第二页page_2
文字内容与对应插画制作 AI 提示词。 - 输出:两张插画图片,类型为 image。
具体细节将在插画制作工作流中详细介绍。
345 页故事插画制作
这个节点同样是调用自定义工作流的节点,与 12 页故事插画制作节点的输入输出要求类似。它们的工作流基本相同,区别在于一个是制作两张插画,另一个制作三张插画。我们完全可以抽象出一个制作单张插画的工作流,并通过遍历pages
循环制作五张插画。
结束
最后一个节点负责将前面所有节点生成的文字、图片等素材按照绘本模板填充输出,作为最终的回答内容。
插画制作工作流
输入每一页的故事文字内容,以及每一页对应的插画制作 AI 提示词。
配图 3 节点是插画生成节点,可以设置模型配置。输入是从上一个工作流传递进来的插画制作 AI 提示词,再与节点的正向提示词合并,同时节点还设置了负项提示词的限制。
输出data
是 image 类型的数据,即图片数据。
图 3 节点不仅生成插画,还需要将每一页的故事文字内容与插画合并制作成一页绘本页,并输出绘本页图片。这就需要借助画板功能。
我们可以看到画板有元素设置,元素指的是画板要填充的数据(可以是图片、文字),元素指的就是元素的数据来源,比如card_3
元素绑定了配图 3 的data
,也就是配图 3 生成的插画图片;page_3
元素绑定了开始节点接收的page_3
变量,即第三页的故事文字内容。
有了元素后,我们需要将其放置到画板上。双击画板打开编辑界面,上部分插入图片,下部分插入区块文本。选中上部分的图片,弹出编辑框,可以选择应用的元素,引用card_3
元素,并进行样式设置,如填充、透明度、描边样式等;选择下半部分区块文本,引用page_3
元素,并设置字体与大小等样式:
最终生成绘本页图片,并输出。
流程图
- 用户输入一个主题或灵感
- 调用故事创作 - 自定义工作流
- 接收用户输入
- 告知用户开始主题创作
- 儿童文学作家故事创作 - 豆包大模型
- 告知用户故事概要
- AI 插画制作提示词专家 - 豆包大模型
- 告知用户正在插画制作
- 12 页故事插画制作 - 自定义工作流
- 接收 1、2 页故事内容和插画提示词
- 分支 1
- 根据提示词生成配图 1-图像生成
- 1 页故事内容与配图 1 组装绘本页 - 画板
- 分支 2
- 根据提示词生成配图 2-图像生成
- 2 页故事内容与配图 2 组装绘本页 - 画板
- 结束 1、2 绘本页制作,并返回 2 张绘本页
- 345 页故事插画制作 - 自定义工作流
- 接收 3、4、5 页故事内容和插画提示词
- 分支 3。略
- 分支 4。略
- 分支 5。略
- 结束 3、4、5 绘本页制作,并返回 3 张绘本页
- 结束。输出文本或最后的 5 张绘本页。
注:coze 支持一个节点分散多个分支,且多个分支允许并行执行,也支持多个分支异步聚合到一个结束节点。
示例
总结
工作流的搭建类似于可视化的编码过程,也需要复用、抽象、封装等编程思想。在实际操作中,建议先对工作流进行流程图打磨和分层设计。
- 工作流分层概念
- 分而治之思维
- 从上到下设计,从下到上实现
- 原子化思想
- 单元测试、集成测试概念
- PDCA 方法论
建议: 从上到下,先梳理步骤,对于复杂任务,分而治之区分顶层大步骤,大步骤细分小步骤,分层后出现顶层流程、顶层包含多个大步骤,大步骤流程,给每个流程画流程图,可以基于梳理结果,AI 辅助生成后调整,根据流程图指导从下层到上层逐步实现,先实现下层工作流,逐步向上完成上层工作流的集成实现。
9ong@TsingChan 2025 markdown