Плохая метафора подобна котёнку с дверцей
Сегодня в стейбл ControlNet вкатили InstantID — модель для переноса лица, которая не требует тренировки (как Lora или дообучение модели), но при этом на голову выше по качеству roop/reactor, и практически не оказывает влияния на скорость генерации.
Кроме очевидного применения (а именно генерации дипфейков Тейлор Свифт) я нашел одно менее очевидное — генерация стабильного лица, то, для чего обычно приходится обучать Lora. Но это лучше показать.
Вот дама, которую я сгенерил ранее в высоком разрешении. А дальше фотокарточки с дамой в едином стиле (но точно так же можно и разнообразить и окружение, и одежду, и прическу, но сохранить общие приметы лица)




Работает это дело через ControlNet, понадобится два слота — первый слот определяет донора лица, второй слот определяет геометрическое положение (то есть это как OpenPose-лайт, заимствуется только положение лица)
Это создает определенное ограничение, но Stable Diffusion достаточно гибок, чтобы построить адекватную картинку вокруг фиксированного лица.
В целом я в восторге. Кажется, я все-таки вернусь к идее нарисовать комикс в Stable Diffusion.
Кроме очевидного применения (а именно генерации дипфейков Тейлор Свифт) я нашел одно менее очевидное — генерация стабильного лица, то, для чего обычно приходится обучать Lora. Но это лучше показать.
Вот дама, которую я сгенерил ранее в высоком разрешении. А дальше фотокарточки с дамой в едином стиле (но точно так же можно и разнообразить и окружение, и одежду, и прическу, но сохранить общие приметы лица)




Работает это дело через ControlNet, понадобится два слота — первый слот определяет донора лица, второй слот определяет геометрическое положение (то есть это как OpenPose-лайт, заимствуется только положение лица)
Это создает определенное ограничение, но Stable Diffusion достаточно гибок, чтобы построить адекватную картинку вокруг фиксированного лица.
В целом я в восторге. Кажется, я все-таки вернусь к идее нарисовать комикс в Stable Diffusion.
29.01.2024 в 23:02
30.01.2024 в 09:38