目录

智能体介绍

本文将为您详细介绍一款专为儿童设计的绘本制作智能体。用户只需提供一个主题或灵感,该智能体便能够基于此生成一个完整的绘本故事,并配以精美的插图,最终输出一本包含五个页面的绘本。

整个创作过程首先由一位“儿童文学作家”大模型生成约 1500 字的绘本故事内容,这包括五个页面的情节划分。在完成故事概要后,系统会通知用户,并由一位“AI 会话提示词专家”根据故事内容准备五页绘本的绘图提示词。随后,工作流将调用绘图模块,每次处理两页的提示词,逐步完成整本绘本的绘制。

智能体设置

这款智能体直接面向用户,其人设与回复逻辑非常简洁明了——无论用户提出何种问题,都会直接触发story_book工作流。

alt text

  • 人设与回复逻辑

    不论用户提出什么问题,都直接调用`story_book`工作流。
    
  • 工作流story_book工作流即中间名为story_book_1_927的工作流。接下来我们将深入探讨这个工作流的具体操作。

  • 开场白

    • 开场白文案
    • 开场白预置问题
  • 背景图片

  • 用户输入方式:默认为打字输入

整体创作工作流

alt text

开始

开始节点定义了一个输入变量user_q。值得注意的是,coze 智能体添加工作流后,无需手动绑定输入变量user_q,coze 会自动完成这一操作。因此,工作流的开始节点输入变量user_q实际上就是用户的输入问题。

alt text

告知开始主题创作

由于 coze 支持并行流程,当开始节点接收到主题后,除了立即进入【儿童文学作家故事创作】节点外,还会同步进入告知节点,及时通知用户故事创作已经开始。

儿童文学作家故事创作

在此节点,系统调用大模型【豆包工具调用】,模拟一位儿童文学作家,基于用户提供的主题生成绘本故事。输出的内容和格式大致如下:

{
    "story_title":"你创作故事的标题",
    "story_summy":"你创作故事的概要,300 字左右",
    "story_hero":"你创作的故事主角的外貌描述,用作制作绘本配图时的提示词",
    "pages":[{
        "page_1":"你创作故事的开头部分",
        "page_2":"你创作故事的发展部分",
        "page_3":"你创作故事的高潮部分",
        "page_4":"你创作故事的解决部分",
        "page_5":"你创作故事的结尾部分"
     }]
}

alt text

告知故事概要

同样地,在故事创作完成后,系统不仅会进入【AI 插画制作提示词专家】节点,还会同步进入告知节点,及时向用户展示已创作的故事概要,让用户提前了解故事内容。

AI 插画制作提示词专家

这个节点的功能可能稍显复杂。它调用了大模型【豆包工具调用】,并通过批处理选择上一节点【儿童文学作家故事创作】的输出变量pages。批处理的设置意味着系统将遍历pages,每一页都会循环调用大模型一次。

输入变量story绑定了每次遍历pages的具体page_x数据,而变量story_hero则绑定了上一节点的story_hero变量。因此,按照上一节点的输出,我们会遍历pages,循环五次,分别将page_1page_5作为本节点的story变量,同时将story_hero变量作为本节点的story_hero变量。经过五次调用大模型后,系统将输出插画制作 AI 提示词,输出结构如下:

{
    "pro_1":"故事开头部分的提示词",
    "pro_2":"故事发展部分的提示词",
    "pro_3":"故事高潮部分的提示词",
    "pro_4":"故事解决部分的提示词",
    "pro_5":"故事结尾部分的提示词"
}

alt text

当然,coze 允许我们在本节点的输出中定义 JSON 数据结构,确保提示词要求的输出格式一致,方便后续节点直接使用本节点的输出变量。

告知正在插画制作

完成 AI 插画制作提示词专家节点后,系统会马上进入告知节点,及时通知用户插画制作正在进行中。

12 页故事插画制作

这个节点调用了自定义工作流(即从资源库引用)。我们只需了解该节点的输入与输出要求即可:

  • 输入:第一页page_1文字内容与对应插画制作 AI 提示词,以及第二页page_2文字内容与对应插画制作 AI 提示词。
  • 输出:两张插画图片,类型为 image。

具体细节将在插画制作工作流中详细介绍。

alt text

345 页故事插画制作

这个节点同样是调用自定义工作流的节点,与 12 页故事插画制作节点的输入输出要求类似。它们的工作流基本相同,区别在于一个是制作两张插画,另一个制作三张插画。我们完全可以抽象出一个制作单张插画的工作流,并通过遍历pages循环制作五张插画。

alt text

结束

最后一个节点负责将前面所有节点生成的文字、图片等素材按照绘本模板填充输出,作为最终的回答内容。

alt text

插画制作工作流

输入每一页的故事文字内容,以及每一页对应的插画制作 AI 提示词。

alt text

配图 3 节点是插画生成节点,可以设置模型配置。输入是从上一个工作流传递进来的插画制作 AI 提示词,再与节点的正向提示词合并,同时节点还设置了负项提示词的限制。

输出data是 image 类型的数据,即图片数据。

alt text

图 3 节点不仅生成插画,还需要将每一页的故事文字内容与插画合并制作成一页绘本页,并输出绘本页图片。这就需要借助画板功能。

我们可以看到画板有元素设置,元素指的是画板要填充的数据(可以是图片、文字),元素指的就是元素的数据来源,比如card_3元素绑定了配图 3 的data,也就是配图 3 生成的插画图片;page_3元素绑定了开始节点接收的page_3变量,即第三页的故事文字内容。

alt text

有了元素后,我们需要将其放置到画板上。双击画板打开编辑界面,上部分插入图片,下部分插入区块文本。选中上部分的图片,弹出编辑框,可以选择应用的元素,引用card_3元素,并进行样式设置,如填充、透明度、描边样式等;选择下半部分区块文本,引用page_3元素,并设置字体与大小等样式:

alt text

最终生成绘本页图片,并输出。

流程图

  • 用户输入一个主题或灵感
  • 调用故事创作 - 自定义工作流
    • 接收用户输入
    • 告知用户开始主题创作
    • 儿童文学作家故事创作 - 豆包大模型
    • 告知用户故事概要
    • AI 插画制作提示词专家 - 豆包大模型
    • 告知用户正在插画制作
    • 12 页故事插画制作 - 自定义工作流
      • 接收 1、2 页故事内容和插画提示词
      • 分支 1
        • 根据提示词生成配图 1-图像生成
        • 1 页故事内容与配图 1 组装绘本页 - 画板
      • 分支 2
        • 根据提示词生成配图 2-图像生成
        • 2 页故事内容与配图 2 组装绘本页 - 画板
      • 结束 1、2 绘本页制作,并返回 2 张绘本页
    • 345 页故事插画制作 - 自定义工作流
      • 接收 3、4、5 页故事内容和插画提示词
      • 分支 3。略
      • 分支 4。略
      • 分支 5。略
      • 结束 3、4、5 绘本页制作,并返回 3 张绘本页
    • 结束。输出文本或最后的 5 张绘本页。

注:coze 支持一个节点分散多个分支,且多个分支允许并行执行,也支持多个分支异步聚合到一个结束节点。

示例

alt text

alt text

alt text

alt text

alt text

总结

工作流的搭建类似于可视化的编码过程,也需要复用、抽象、封装等编程思想。在实际操作中,建议先对工作流进行流程图打磨和分层设计。

  • 工作流分层概念
  • 分而治之思维
  • 从上到下设计,从下到上实现
  • 原子化思想
  • 单元测试、集成测试概念
  • PDCA 方法论

建议: 从上到下,先梳理步骤,对于复杂任务,分而治之区分顶层大步骤,大步骤细分小步骤,分层后出现顶层流程、顶层包含多个大步骤,大步骤流程,给每个流程画流程图,可以基于梳理结果,AI 辅助生成后调整,根据流程图指导从下层到上层逐步实现,先实现下层工作流,逐步向上完成上层工作流的集成实现。


9ong@TsingChan 2025 markdown