Eu faria um processo em várias etapas Primeiro, pedir ao ChatGPT ou a outra API de LLM para criar um storyboard de tira de quadrinhos com cada caixa descrita Depois, gerar essas Depois, pedir ao Nano Banana ou a outro modelo de edição para juntá-las Ou alguma ordem diferente disso Você geralmente pode melhorar as coisas fazendo as coisas em etapas separadas como um pipeline