Следующим шагом было использование онлайн программы Clip Interrogator, которая по имеющемуся изображению составляет текстовый промпт для Stable Diffusion (описание работы с ней – в нашей статье «Введение в генерацию изображений с помощью Stable Diffusion»). В качестве исходного изображения использовали 5 найденных в интернете фотографий медведя с нужного верхнего ракурса. Интересно, что Clip Interrogator для каждой из 5 фотографий выдавал разные промпты. Подчистив эти промпты и слегка их меняя мы стали подавать их в Stable Diffusion и получать приемлемые изображения. Но это оказалось довольно трудоемко и все равно не гарантировало 100% приемлемого сюжета, так как Stable Diffusion реагирует на любые изменения в промпте и при этом не всегда предсказуемо. Тогда появилось желание автоматизировать процесс генерации. Самый простой способ – использовать изменение параметра seed – начального состояния генератора. Это дает разнообразие изображений в рамках одного промпта и гарантирует стабильность сюжета. Однако нам требовалось большее разнообразие сюжетов и тогда использовали орисанную ниже технологию. Если рассмотреть промпт, выданный программой Clip Interrogator, то видно, что он состоит из нескольких типовых частей. Рассмотрим один из вариантов: