// MANUAL / TUTORIAL

ИИ-замена лица выдаёт чужого человека: где ломается сходство

Сходство ломается не случайно. Искажение черт почти всегда сводится к одной из пяти причин: слабый референс, режим text-to-image вместо image-to-image, стилизующие слова в промпте, встроенная тяга модели к 'средней красоте' и завышенный параметр креативности. Сначала определите масштаб: уплыли одна-две черты или всё лицо целиком. Эта развилка делит проблему надвое и ведёт к разным фиксам. Дальше вы сопоставляете симптом с причиной и применяете точечное исправление вместо слепой перегенерации. Ниже каждая причина разобрана как ветка диагностического дерева, плюс готовый Identity Lock блок для удержания уникальных черт.

Как быстро понять, что именно пошло не так

Поставьте оригинал и результат рядом в одном масштабе и обрежьте всё, кроме лица. На общем плане мозг сам достраивает сходство, вблизи же обман виден сразу.

Расстояние между глазами и их посадка: это выдаёт подмену первым.
Ширина носа и форма ноздрей.
Изгиб верхней губы.
Родинки, шрамы и природная асимметрия лица, которую модель особенно любит стирать.
Форма ушей и мочек, если они в кадре.

A side-by-side comparison of one woman's face, her real reference photo on the left and an AI face swap on the right that widened the nose and erased a small cheek mole. Both heads are cropped tight at identical scale on a plain grey studio wall, with thin labels reading 'оригинал' and 'результат' set above each face in dark grey sans-serif caps. Soft frontal softbox light, cool neutral white, falls evenly across both faces so the shifted eye spacing and lip curve stay plainly visible.

Есть проверка надёжнее линейки. Покажите результат тому, кто хорошо знает героя фото, и не предупреждайте, что картинку рисовал ИИ. Спросил, что не так с лицом? Значит, сходство потеряно объективно, а не в вашем воображении.

Теперь оцените масштаб потери. Уплыли одна-две конкретные черты, скажем нос стал шире, а губы тоньше? Это узкая правка. Лицо изменилось целиком и человек стал чужим? Корень глубже, в качестве референса или самом режиме генерации. Две ситуации ведут по разным веткам, поэтому развилку проходим до выбора фикса.

Причина 1: плохой референс, модель не видит лицо достаточно чётко

Модель восстанавливает лицо только из того, что есть на референсе, и слабое исходное фото остаётся самой частой причиной потери сходства. Подробный разбор требований к референсу публикует qreator.ru.

Разрешение от 1500 px по короткой стороне, как требует qreator.ru.
Лицо занимает минимум 30% кадра.
Поворот головы не больше 45°, иначе модель додумывает скрытую половину (наблюдение dtf.ru).
Держите в кадре одного человека: чужие лица уводят модель с цели.
Снимок без фильтров и без компрессии, в идеале сделанный специально под генерацию с ровным светом и нейтральным фоном.

Обзор ArtOfMagic AI на RuStore: бесплатный AI-редактор без регистрации

ArtOfMagic AI от softgame-sm раздаёт через RuStore семь AI-функций без регистрации и подписки: замену лица, генерацию по тексту на базе GPT-4 Image, Stable Diffusion и Flux, превращение фото в 3D-фигурку. Главный риск: политика конфиденциальности разработчика публично не раскрыта, поэтому загружать чужие лица без согласия не стоит.

Почему RuStore стал основной точкой входа для российских Android-пользователей

Источник файла решает не меньше цифр. Фильтры FaceApp и TikTok перекраивают геометрию и текстуру лица ещё до загрузки, и нейросеть честно копирует уже испорченное лицо. Снимки из сторис и пересланные в мессенджере фото ужаты алгоритмами доставки: стёртые компрессией детали не вернёт ни одна модель. Классический провал: аватарка из Telegram на 400 px выдаёт мыльного незнакомца, а тот же человек в несжатом оригинале с нейтральным фоном снова узнаётся.

Быстрый тест перед загрузкой. Откройте референс во весь экран. Видите зерно, мыло или квадраты пикселей? Модель видит ровно то же самое и недостающее не угадает.

Причина 2: неправильный режим генерации, text-to-image не сохраняет конкретного человека

Каждая перегенерация выдаёт новое чужое лицо? Дело не в промпте, а в режиме. text-to-image не получает вашего фото вообще: модель собирает лицо из латентного пространства по текстовому описанию, и попадание в конкретного человека здесь чистая случайность.

image-to-image устроен иначе. Режим берёт исходное изображение за опору и держит сходство заметно лучше. Для сохранения конкретного человека выбирайте сервисы с поддержкой image-to-image, например Nano Banana 2 / PRO или Seedream 4.5.

Midjourney, Stable Diffusion и DALL-E в чистом text-to-image не созданы удерживать конкретное лицо без специальных надстроек вроде IPAdapter или обученной LoRA. Запрос 'женщина 35 лет с каре' выдаст женщину 35 лет с каре, но не вашу подругу.

A split-screen result from one selfie, the left half labeled 'text-to-image' showing a random stranger's face and the right half labeled 'image-to-image' showing a close match to the source person. The same young man's reference sits as a small inset square between the two halves on a dark slate background, with a thin vertical white divider splitting the frame. Cool even studio light from straight ahead keeps both generated faces equally lit, flattening shadows so the identity differences read clearly.

Причина 3: промпт запускает стилизацию и отрывает результат от референса

Часть слов тихо переключает модель из режима копирования в режим художника. cinematic, epic, dramatic, artistic, stylized, award winning, professional photo: по наблюдениям qreator.ru, каждое смещает приоритет с сохранения референса на эффектную интерпретацию. Вычистите их полностью.

Длина промпта работает против вас не меньше. Текст на 2000 символов и больше с десятками деталей сцены распыляет внимание модели по всем токенам, и вес инструкции про лицо падает. Оставьте Identity Lock блок плюс две-три фразы о сцене, остальное лишнее.

Минимальный вариант для чат-ботов вроде ChatGPT: дописать в запрос 'сохранить идентичность, не менять черты лица'. Грубо, но уже лучше, чем ничего.

Надёжнее работает готовый Identity Lock блок: короткий список черт, которые модель обязана повторить дословно. Базовая версия умещается примерно в 250 символов.

Keep the exact identity of the person in the reference photo. Do not change facial geometry: eye spacing, nose width, nostril shape, the curve of the upper lip. Preserve every mole, freckle and the natural left-right asymmetry. Keep the real skin texture and age. Same face, same person.

Для упрямых случаев, когда лицо всё равно уплывает, разверните блок примерно до 650 символов и перечислите черты подробно.

Preserve the precise identity of the person from the reference image with photographic accuracy. Lock these traits exactly: the distance between the eyes, the width and bridge of the nose, the shape of the nostrils, the curve of the upper lip, the shape of the ears and earlobes, the jaw and chin line. Keep every mole, freckle and scar, and the natural asymmetry between the left and right sides of the face. Do not smooth wrinkles, do not slim the face, do not change skin tone, eye color or ethnic features. Match the person's real age. The result must read as the same individual photographed under different light, never a younger or beautified lookalike.

Каждая фраза тут несёт нагрузку. eye spacing держит посадку глаз, nostril shape запрещает перерисовывать ноздри, preserve every mole and natural asymmetry прямо блокирует симметризацию, а match the real age гасит автоомоложение. Модель исполняет конкретику, а не размытое 'сделай похоже'. Сохраните рабочий блок как шаблон и вставляйте его в каждый новый промпт.

В поле отрицательных подсказок добавьте: без искажений, без асимметрии, без деформированных черт, анатомически правильно. Это отсекает грубый брак анатомии, хотя само сходство держит Identity Lock, а не негативы.

Причина 4: регрессия к среднему, модель сглаживает индивидуальность

Иногда лицо не ломается, а молодеет и хорошеет без вашей просьбы. Это регрессия к среднему: модель подтягивает любое лицо к статистическому центру обучающей выборки.

Откуда берётся этот центр. Сети учились на миллионах отретушированных, симметричных, заведомо 'красивых' портретов, поэтому усреднённое лицо для них и есть эталон. Классический датасет CelebA, описанный на habr.com, содержит 200 000 фотографий 10 000 знаменитостей: на нём обучали GAN, и смещение к глянцевым лицам встроено в саму выборку.

Без явной команды модель убирает то, что считает изъянами: асимметрию, родинки, морщины, иногда этнические черты и природный цвет глаз. На выходе приглаженный незнакомец вместо конкретного человека.

A close-up portrait of an older man whose AI-generated version floats beside his real face, the synthetic one visibly younger with smoothed plastic skin, a removed cheek mole and forced left-right symmetry. He faces the camera against a soft charcoal background, with fine wrinkles and one crooked eyebrow surviving only on the real face. Warm key light from the upper left rakes across the skin, exposing real texture on one side and an unnatural matte sheen on the averaged one.

Старые GAN-архитектуры страдают сильнее. ProGAN и StyleGAN, по данным habr.com, обучают на стандартных и зеркально отражённых версиях изображений, отсюда вечные сбои с асимметрией: разные серьги и перекошенный взгляд, парные детали не совпадают.

Противоядие одно: тот же Identity Lock с поимённым перечислением уникальных черт. Пока асимметрия и родинки не названы прямо, модель считает их шумом и стирает.

Причина 5: высокий параметр стилизации или неправильный порядок загрузки

Последняя группа причин прячется в настройках. Ползунок transformation strength или creativity на высоком значении прямо разрешает модели уходить от референса. Опустите его к минимуму и перегенерируйте, нередко одного этого хватает. Привычка начинать с низкого значения и поднимать только при необходимости экономит десятки попыток.

Порядок загрузки тоже влияет. По данным dtf.ru, при пакетной загрузке первые 3–4 кадра получают больший вес при анализе, поэтому ставьте лучшие снимки в начало очереди, а не в конец.

Одного фото мало. Дайте модели 2–3 качественных референса с разных ракурсов: анфас, поворот на 45°, профиль. Обратный случай встречается постоянно: человек грузит 10 кадров строго анфас, модель не видит лицо сбоку и лепит усреднённую маску. Десять одинаковых ракурсов проигрывают трём разным.

Диагностическое дерево: какая причина у вас

Сведём всё в одну развилку. Найдите свой симптом в левом столбце и идите по строке к фиксу.

Симптом	Вероятная причина	Что сделать
Уплыло всё лицо, человек стал чужим	Слабый референс или режим text-to-image	Проверить разрешение и переключиться на image-to-image
Уплыли 1–2 конкретные черты	Модель не получила их как обязательные	Назвать черты явно в Identity Lock и перегенерировать
Лицо омоложено и симметрично	Регрессия к среднему	Добавить в Identity Lock родинки, морщины и асимметрию
Кино-эффект, живопись, глянец	Стилизующие слова в промпте	Удалить cinematic, epic, artistic и подобные
Лицо размыто или пластиковое	Низкое разрешение референса	Взять фото от 1500 px по короткой стороне

Что делать, если ничего не помогло: fallback-стратегия

Иногда ни один фикс не держит лицо. Тогда меняют стратегию, а не параметры.

Разбейте задачу на этапы. Сгенерируйте сцену без лица или с любым лицом, а затем наложите нужное отдельным проходом face-swap. Модели проще сохранить лицо, когда это её единственная задача в кадре.

Если результат почти удачен, выручает inpainting. Замаскируйте только фон или одежду и перегенерируйте маскированную область, не трогая лицо. Так удачное сходство не разрушается при правке остального.

Уплыли всего одна-две черты? Часто быстрее поправить их в Photoshop, чем гонять полную перегенерацию ради одного носа. К этому пути приходят многие, когда лицу не хватает совсем чуть-чуть.

Технические пользователи в Stable Diffusion копают глубже: обученная LoRA на лицо конкретного человека и IPAdapter, переносящий черты прямо с референса. Это не для новичка, но именно сюда стоит смотреть, когда сходство нужно стабильно и в потоке.

Blowyourbrain 2026-06-04

по сути всё сводится к одному: image-to-image вместо text-to-image. остальные четыре причины это уже тонкая настройка, но пока человек сидит в text-to-image и ждёт что выйдет именно его жена, никакой identity lock не поможет

ZywOo 2026-06-05

у меня seedream держал лицо нормально пока я creativity не задрал. скинул почти в ноль и сразу узнаваемо. до этой статьи полгода тыкался вслепую

KaiCenat 2026-06-05

а ползунок creativity это где, у меня в nano banana его нет вроде

Blowyourbrain 2026-06-06

@KaiCenat в нано банане явного слайдера нет, там это в формулировку промпта зашито. слайдер ты в стейбле найдёшь

Bad Bunny 2026-06-06

закинул аватарку из телеги и получил мыльного незнакомца, всё как в тексте про 400px

ElkY 2026-06-06

telegram же режет пересланное и сторис в кашу, тут не разрешение виновато а компрессия доставки. оригинал надо отдельным файлом просить

Aikster 2026-06-07

image-to-image согласен, остальное по ситуации

aminematue 2026-06-08

пробовал я этот identity lock, лицо всё равно молодеет. блок на 650 символов вставлял дословно

ElkY 2026-06-09

@aminematue а родинки и асимметрию ты в блок поимённо вписывал? без явного перечня модель их за шум считает и стирает, это причина 4

aminematue 2026-06-09

вписывал. ну то есть короткую версию на 250 вписывал, длинную честно не пробовал

WWE 2026-06-09

вопрос который статья обходит: вы все эти лица в облако грузите? nano banana, seedream это же чужие сервера, фото человека улетает неизвестно куда

KiWiKiD 2026-06-10

@WWE вот именно. поэтому у меня только локальный SD с ipadapter, лицо с компа не уходит. возни больше, зато свои фото у себя

KaiCenat 2026-06-11

а ipadapter это сложно поставить?

Blowyourbrain 2026-06-12

@KaiCenat не для первого дня, но и не ракета. lora на конкретное лицо сложнее, там датасет собирать надо

Riot Games 2026-06-12

tldr, проскроллил сразу к таблице симптомов. таблица топ, остальное потом дочитаю

ZywOo 2026-06-13

таблица да, единственное что реально по делу. симптом, причина, фикс, без воды

Juan De Dios Pantoja 2026-06-13

ого а я не знал что text-to-image вообще моё фото не видит. думал просто плохо срабатывает. это многое объясняет

ElkY 2026-06-13

@Juan De Dios Pantoja именно, оно лицо из латентного пространства собирает по описанию. 'женщина 35 с каре' и выдаст какую-то женщину 35 с каре, не твою

Bad Bunny 2026-06-14

у меня из 137 генераций дай бог три попали в человека, пока на image-to-image не переехал

Aikster 2026-06-14

137 это вы ещё терпеливый

aminematue 2026-06-15

а мне и image-to-image не панацея. лицо в целом моё, но нос каждый раз шире. отдельно нос в фотошопе и правлю уже

Blowyourbrain 2026-06-15

@aminematue нос это узкая правка, статья верно пишет, назови nostril shape и nose width прямо в блоке. но если лень, фотошоп быстрее да

WWE 2026-06-16

CelebA это же датасет гугла если память не врёт, вот оттуда и глянец весь

KaiCenat 2026-06-16

а что за регрессия к среднему, не понял этот кусок

ElkY 2026-06-16

@KaiCenat модель любое лицо тянет к усреднённому 'красивому', потому что на таких и училась. убирает асимметрию морщины родинки, считает их дефектом

Juan De Dios Pantoja 2026-06-17

о это прям про мой случай!! генерил бабушку, вышла её помолодевшая версия лет на 20, я аж залип

ZywOo 2026-06-17

классика. автоомоложение лечится только match the real age в блоке, и то не всегда

Bad Bunny 2026-06-19

звучит как пресс-релиз местами если честно, особенно про 'готовый identity lock блок'. на проде половина моделей его игнорит

Blowyourbrain 2026-06-19

@Bad Bunny не игнорит, а вес теряет когда промпт на 2000 символов. оставь lock плюс пару фраз сцены, остальное режь и заработает

Bad Bunny 2026-06-19

ну спорно. у меня и с коротким промптом улетало

KiWiKiD 2026-06-20

порядок загрузки кстати реально влияет, не выдумка. ставлю лучший кадр первым и разница есть. dtf про первые 3-4 кадра не врёт

Riot Games 2026-06-20

первые читаю, остальное вечером с компа допишу

Juan De Dios Pantoja 2026-06-20

а сколько фоток грузить оптимально? я по одной всегда кидал

ElkY 2026-06-21

@Juan De Dios Pantoja 2-3 с разных ракурсов, анфас поворот профиль. десять одинаковых анфасов хуже трёх разных, модель сбоку лицо не видит

aminematue 2026-06-21

вот про разные ракурсы нигде раньше не встречал, грузил всегда пачку анфасов

WWE 2026-06-22

а fallback через face-swap отдельным проходом кто пробовал? по приватности это ещё хуже, лицо два раза в облако гоняешь

KiWiKiD 2026-06-22

@WWE локально и face-swap локальный есть. но да, если облачный сервис то фото гуляет дважды, согласен

KaiCenat 2026-06-22

погодите, а inpainting это что в этом контексте

ElkY 2026-06-23

@KaiCenat маскируешь фон или одежду и перегенеришь только её, лицо не трогаешь. удачное сходство не разваливается при правке остального

Aikster 2026-06-23

inpainting спасает чаще всего, по моему опыту

ZywOo 2026-06-24

не, ну в идеальном мире. у меня маска подтекала и кромка лица всё равно менялась

Blowyourbrain 2026-06-24

маску по лицу с запасом веди, не впритык. тогда кромка целая

Bad Bunny 2026-06-25

так, а кто nano banana 2 с seedream 4.5 сравнивал вживую? на сходстве кто держит лучше

aminematue 2026-06-26

я бы сказал seedream стабильнее, но могу врать, давно банан не трогал, мб уже подтянули

ElkY 2026-06-26

оба норм пока creativity низкий. выше среднего и обе уплывают, разница стирается

Juan De Dios Pantoja 2026-06-26

а можно вообще без фото, просто описанием добиться конкретного человека?

Blowyourbrain 2026-06-27

@Juan De Dios Pantoja нет. это и есть причина 2, text-to-image конкретного человека не повторит, только типаж

KaiCenat 2026-06-28

понял. вообще статья глаза открыла, месяц мучился и не понимал почему чужие лица лезут

WWE 2026-06-28

цена вопроса ещё. seedream сколько за пачку генераций берёт, кто в курсе

Riot Games 2026-06-29

хз, я на бесплатных лимитах сижу

KiWiKiD 2026-06-29

приватнее всё равно локально, и без подписок. видяха только нужна нормальная

aminematue 2026-06-30

у меня 1660 не тянет sdxl толком, так что облако поневоле

Bad Bunny 2026-06-30

stylegan кстати на зеркальных картинках учили, оттуда и серьги разные вечно. это в статье про асимметрию хорошо подмечено

ElkY 2026-07-01

ага, progan и stylegan на отражённых версиях, парные детали и плывут. но на новых диффузионках уже сильно лучше с этим

ZywOo 2026-07-01

лучше да, но не идеально. у меня вчера опять серьга одна была, на seedream

Aikster 2026-07-02

одна серьга это меньшее из зол честно

Juan De Dios Pantoja 2026-07-02

а родинку как заставить нарисовать если её модель упорно стирает, три раза перегенерил

ElkY 2026-07-02

@Juan De Dios Pantoja словами в lock: preserve the mole under left eye, конкретно где. общее 'keep moles' слабее работает

WWE 2026-07-03

коллега вчера на созвоне как раз про эти родинки ныл, скину ему ветку

Bad Bunny 2026-07-03

negative prompt про деформации помогает или плацебо? добавляю 'без искажений' и не вижу разницы

Blowyourbrain 2026-07-04

негативы анатомию чистят, грубый брак режут. но само сходство держит не они а lock, статья прямо это пишет. так что разница есть но не там где ты ждёшь

aminematue 2026-07-04

вот это важный момент, я думал негативы за сходство отвечают и сливал туда всё подряд

KaiCenat 2026-07-05

а если лицо в профиль почти, 60 градусов поворот, совсем безнадёга?

ElkY 2026-07-05

@KaiCenat больше 45 модель скрытую половину уже додумывает, так что считай да. дай ей кадр поровнее

ZywOo 2026-07-05

в 2 ночи это читаю и понимаю что полгода всё делал не так. завтра перегенерю по-человечески

Aikster 2026-07-06

image-to-image, низкий creativity, родинки в lock. весь смысл в трёх строках

Juan De Dios Pantoja 2026-07-07

а кто-нибудь добивался стабильного лица в потоке без lora, чисто на ipadapter? или всё равно к lora приходишь