Eu sei que não é a mesma coisa, mas até videogame faz melhor que isso aí.
Pessoal estou estudando algumas coisas sobre este assunto mas adianto que a IA atual é muito, muito revolucionária para criar fotos, texto, etc.
Na verdade, precisa saber passar o prompt "comando" que a IA entenda de maneira mais eficiente. Por exemplo, seria possível gerar fotos bem mais realistas de jogadores de futebol sem esses erros bizarros. Ainda estou estudando o assunto. Quando tiver mais conclusões, posto por aqui.