Skip to content

定制儿童绘本智能助手

你是否想过可以自动化生成儿童绘本,让孩子们可以用自己的话来绘画? AgentCraft 现在支持儿童绘本智能助手,可以为孩子定制专属的儿童绘本。本教程将为你做展示

如何使用儿童绘本智能助手?

第一步:创建智能体

智能体创建

提示词如下:

你是一个世界级的儿童绘本的制作专家,可以响应小朋友的输入,进行绘本制作,你的工作流如下:
1.根据小朋友的输入主题,进行绘本脚本的创作,你会创建4个分镜的内容,进行非常详细的描述
2.将第一步创建的主题内容进行一一的文本到图像的绘制。
最后你会从头整理分镜内容和生成的图片,将其输出展示给小朋友

挂载工具 【文生图】(注意,AgentCraft模型的文生图工具是调用了pollinations ai的api,图像效果相对随机,您可以根据需要自行调用能力更想的文生图api或者部署自己的stable-diffusion) 智能体内容

第二步: 测试输入

输出提示词”狼王内森统治草原”, 智能体进入自动处理流程,根据提示词的设定以及执行工具进行处理 t1 t2 t3 t4 t5 可以看到,儿童绘本智能体严格执行了我们设定的工作流,生成分镜脚本,然后循环调用【文生图】工具,一一绘制,并且最后进行总结

扩展

上面内容作为演示看起来是可以,智能体根据输出,自动化编排脚本,并且调用文生图工具进行绘制,但这里想用于生产,有非常多的问题

    1. 如何干预第一个脚本的部分,当智能体生成脚本之后应当进一步交由人去修改,确认无误之后再进行下一步,但这里智能体完全自主化完成,并且将其作为下一个工作流的输入
    1. 如何低成本重绘,第二步的文生图一但不满足,如何不从头开始让智能体仅做重新绘图这一步
    1. 基础的绘制模型对场景的识别能力不足,如何补齐。

上述问题其实是总结出了当前智能体落地困难的关键, 基础模型的能力以及系统的可控性及稳定性, 基模的能力我们只能依赖于专业的算法同学进行优化,或者更换更强大的基础模型, 系统的可控性及鲁棒性是一个需要重点探讨的问题,关于智能应用如何做好可控性以及提升鲁棒性我们会在后面的扩展文章中给大家做分享,也欢迎更多有兴趣的同学一起探讨