Head swap и face swap: в чём принципиальная разница и какую технологию выбрать
Face swap подменяет только зону лица: глаза, нос, рот и контур щёк. Причёска, уши и форма черепа остаются от исходного фото. Head swap идёт дальше: заменяется голова целиком, вместе с волосами и силуэтом, а тело и фон сохраняются. Технически head swap сложнее, потому что после переноса головы в фоне образуется пустота (её достраивают через inpainting), и новая голова должна органично совпасть по цвету и освещению. Главный триггер для выбора head swap: у донора и реципиента сильно отличается причёска или форма головы. Когда причёски похожи, face swap справляется быстрее и проще.
Коротко: в чём главное отличие
Разница в том, что именно нейросеть забирает у донора и переносит на целевое фото. Face swap берёт только лицо. Head swap забирает всю голову.
| Параметр | Face swap | Head swap |
|---|---|---|
| Область замены | Только лицо: глаза, нос, рот, контур щёк | Голова целиком: лицо, волосы, контур черепа |
| Что остаётся нетронутым | Причёска, уши, шея, тело, фон | Тело и фон (новая голова дорисовывается в существующее окружение) |
| Типичный результат | Узнаваемое лицо донора с причёской и формой головы реципиента | Полностью новая голова на исходном теле и фоне |
Что такое face swap: как работает замена лица
Face swap – это автоматический перенос области лица с одного изображения на другое с сохранением мимики и условий освещения целевого кадра. Нейросеть не пересаживает кожу пиксель в пиксель, а реконструирует лицо донора так, чтобы оно повторяло выражение лица реципиента.
Сначала модель находит на лице ключевые точки (landmarks), по которым ориентируется при наложении:
- глаза и брови,
- нос и его кончик,
- уголки рта и линия губ,
- контур подбородка и щёк.
По данным Skillbox, нейросеть параллельно изучает освещение и ракурс, после чего синтезирует новое лицо. Под капотом обычно сочетаются CNN (анализ черт), GAN (генерация) и автоэнкодеры. В классической схеме на автоэнкодерах для двух людей обучается общий энкодер и два разных декодера; на инференсе декодеры меняют местами, и лицо донора оказывается на снимке реципиента с его мимикой, как описывает команда Sber AI на Habr.
Слабое место технологии заложено в её допущении. Face swap предполагает, что форма лица source и target примерно одинакова. Если у одного человека круглое лицо, а у другого узкое, нейросети нечем компенсировать разницу: на границе лица появляется шов, контур щёк выглядит чужеродно. То же касается причёсок. Голова донора как объёмный 3D-объект в кадр не попадает, перенесётся только плоский фронт лица.
Что такое head swap: как работает замена головы
Head swap заменяет на целевом фото всю голову: лицо, волосы и контур черепа. Тело, одежда и фон остаются от исходного снимка. В отличие от face swap, нейросети приходится решать две дополнительные задачи.
- Inpainting фона: дорисовать участки за головой, которых на оригинале не было видно.
- Цветовая адаптация: подогнать тон кожи и волос новой головы под освещение исходного фото.
Эти этапы реализованы в архитектуре HeSer, на которой базируется GHOST 2.0 от Sber AI. По описанию команды на Habr, модель состоит из двух модулей. Aligner реконструирует голову донора с помощью GAN: воссоздаёт её в нужном ракурсе и с нужной мимикой. Blender аккуратно вставляет полученную голову в целевое изображение, заодно достраивая фон и согласовывая цвета.
Чтобы Aligner понимал, что именно надо сохранить от донора, а что взять у реципиента, в GHOST 2.0 используются три энкодера:
- портретный энкодер на ResNet кодирует identity по всей голове, включая причёску;
- энкодер identity на ArcFace работает с кропом лица и хранит черты человека;
- энкодер движения на MobileNetV2 описывает позу и мимику исходного кадра.
Самая сложная зона – волосы. Кудри, пушистые пряди и сильный контраст с фоном дают артефакты даже у топовых моделей: на bratuha.ru авторы прямо предупреждают, что такие участки могут смотреться неестественно.
Сравнительная таблица: head swap vs face swap
| Критерий | Face swap | Head swap |
|---|---|---|
| Область замены | Только лицо | Голова целиком (лицо + волосы + контур) |
| Что сохраняется у реципиента | Причёска, форма головы, тело, фон | Только тело и фон |
| Техническая сложность | Ниже: достаточно перенести лицо | Выше: добавляются inpainting фона и цветовая адаптация |
| Типичные артефакты | Швы по контуру лица, особенно при разной форме головы | Неестественные волосы, видимая граница на пушистых прядях |
| Скорость обработки | ≈ 7 с (AI Face Swap, Fotomaster) | ≈ 13 с (AI Headshot, Fotomaster); 5–10 с (VidMage) |
| Когда выбирать | Похожие причёски, быстрые соцсети и мемы | Разная форма головы или причёска, профессиональные фото |
По данным Fotomaster, face swap обрабатывается заметно быстрее: в среднем 7 секунд против 13 на head swap. У VidMage заявленное время head swap составляет 5–10 секунд. Цифры понятны: head swap делает больше работы за один проход.
Когда использовать face swap, а когда head swap
Face swap уместен, когда от исходного фото нужно сохранить именно облик: причёску, головной убор, ракурс. Типичные сценарии:
- быстрые мемы и реакции для соцсетей,
- замена лица на групповом снимке, где остальное должно остаться нетронутым,
- видеоконтент, где у героя и донора похожие причёски,
- кейсы, в которых важна скорость, а не идеальный результат.
Head swap имеет смысл там, где причёска и форма головы донора важны и должны попасть в кадр:
- корпоративные портреты, где нужно заменить голову сотрудника, не подгоняя его причёску под чужую;
- восстановление старого семейного фото с повреждённой головой;
- кино и реклама: дублёры в опасных сценах, омолаживающий эффект, работа с двойниками;
- ситуации с сильно разной формой головы у исходного и целевого человека.
Простое правило выбора. Если причёски и форма головы у донора и реципиента похожи, берите face swap: он быстрее и реже даёт артефакты. Если различие явное (пышные кудри против короткой стрижки, круглое лицо против узкого), переходите на head swap. Тот же триггер возникает, когда нужен именно облик донора целиком, а не только его лицо.
Почему head swap технически сложнее: inpainting и цветовая адаптация
Face swap живёт на одном допущении: формы лица source и target одинаковы. Команда Sber AI прямо пишет на Habr, что при нарушении этого условия качество переноса падает, и именно поэтому появилась отдельная задача head swap.
Замена головы целиком разрушает целостность исходного кадра. Старая голова занимала какое-то место на фоне. Когда её убирают, в этой зоне остаётся прямоугольник без пикселей. Восстановить эти пиксели – задача inpainting. Модуль Blender в HeSer и GHOST 2.0 достраивает фон так, чтобы за новой головой не оставалось видимой границы или повторяющегося паттерна.
Вторая задача – цветовая адаптация. Донор был сфотографирован в одном освещении, реципиент в другом. Просто вставить голову нельзя: она будет светлее, теплее или холоднее, чем шея и плечи под ней. Blender перекрашивает кожу и волосы под условия исходного фона, чтобы граница между головой и шеей читалась как анатомическая, а не как монтажный шов.
Самое узкое место всё равно остаётся вверху. Волосы дают сложные контуры с прозрачностью. На контрастном фоне (например, тёмные кудри против белой стены) ИИ часто оставляет ореол или подрезает пряди ровной линией. Это видимый признак head swap, по которому изображение опознают как сгенерированное.
Инструменты: что попробовать прямо сейчас
Для head swap из доступного в России выделяются:
- GHOST 2.0 от Sber AI – опенсорс, первая открытая модель переноса головы; для запуска нужны технические навыки;
- bratuha.ru – веб-сервис, замена головы стоит 5 рублей за изображение;
- VidMage – обработка одного фото за 5–10 секунд, загруженные снимки удаляются в течение двух часов;
- Magic Hour – зарубежный сервис с поддержкой head swap для фото и видео.
Для face swap список длиннее. Из заметного:
- DeepFaceLab – опенсорс, создан российским разработчиком Иваном Перовым, репозиторий на GitHub содержит подробные руководства;
- Remaker AI и Pica AI – веб-инструменты для быстрой замены лица на фото;
- FaceSwap от GPTunneL – интегрированный инструмент в экосистеме AI-сервисов с возможностью оживить результат другими моделями.
Политики хранения данных у этих инструментов разные. По собственной декларации, VidMage удаляет загруженные фото через два часа после обработки и не использует их для обучения ИИ. Facy.ai требует подтверждения, что у пользователя есть законное право на загружаемые изображения, и запрещает материалы с лицами младше 18 лет. Перед загрузкой чужих фото читайте условия каждого сервиса отдельно: они отличаются заметно.
Частые заблуждения
Миф: head swap и face swap – одно и то же
Технологии решают разные задачи. Face swap меняет только лицо, оставляя причёску и форму головы реципиента. Head swap забирает у донора всю голову целиком: лицо, волосы и силуэт. Разные задачи – разная архитектура (Aligner и Blender в head swap, автоэнкодеры в классическом face swap) и разная скорость обработки.
Миф: face swap и deepfake – синонимы
Face swap – конкретная технология переноса лица. Deepfake – зонтичный термин, который включает и синтез голоса, и изменение мимики, и генерацию полностью искусственных видео. На vc.ru обоснованно отмечают, что термин «face swap» точнее, а «deepfake» в медиа окрашен скорее негативно. Не каждый face swap является deepfake, и не каждый deepfake сделан через face swap.
Миф: знаменитый deepfake с Томом Крузом сделан только нейросетью
Это коллективный продукт. По разбору команды Sber AI на Habr, в основе сразу несколько факторов: исходная похожесть актёра-двойника на Круза, очень долгое обучение модели, большой объём референсного видео с лицом актёра и покадровая ручная постобработка. «Чистый» face swap нейросетью без подобранного двойника и ручной правки такого качества не даст.
вау, я думал face swap и head swap это одно и то же. полез смотреть ghost 2.0
волосы это боль. на любой нейронке кудри в ореоле плывут, никто не починил
в статье хорошо описан Aligner + Blender, но нигде нет про то, как ведёт себя head swap на profile (3/4 поворот). у меня на тестах из 87 фото половина с боковым ракурсом давала шов на щеке
плюсую
пробовал bratuha за 5р, на мужской короткой стрижке ок, на длинных волосах кашемир какой-то
а кто-нибудь проверял, что vidmage реально удаляет через 2 часа? их декларация и реальность это разные вещи
vidmage у меня вообще не открылся с карты мир, оплата отвалилась
а можно head swap на видео? или только фото
звучит как пресс-релиз. "первая открытая модель переноса головы" ну ок
в ghost вроде используется ArcFace на всю голову, а не на кроп. могу путать
@Joe Albanese наоборот, ArcFace на кроп лица, ResNet на всю голову с причёской. в статье прямо это написано
facy.ai требует подтверждать права на фото, это хоть какой-то фильтр, но проверки нулевые
+
7 секунд против 13, ну в идеальном мире. на бесплатном тарифе у fotomaster очередь минут на 20
короче, скачал ghost, не запустилось. cuda какая-то ругается
@Cocomelon ну а ты на чём пробуешь, на ноуте без видяхи? там минимум 12гб vram надо
я гонял на 3090, инференс на одном фото в районе 4 сек, но первая загрузка модели 23 секунды
мне для мемов хватает remaker, что вы все так усложняете
remaker водяной знак ставит на бесплатном, а pro не работает с рф картами
да и pica ai отвалилась у меня в марте, подписка списалась, доступа нет. до сих пор не вернули
вот про что и речь. отдаёшь фото в облако, а потом ни сервиса, ни данных, и где они теперь эти фото
deepfacelab локально гоняется, никто никуда фото не сливает. для меня это единственный вариант если речь про чужие лица
deepfacelab это про видео в основном, для одного фото это как из пушки по воробьям
а на телефоне есть что-то приличное?
в обед читаю, дочитал до миф про круза и думаю, ну да, без двойника и ручной правки никакой нейронки не хватит
больше всего бесит что про limit на разрешение никто не пишет. у меня портрет 4200x6300 и ни один сервис не вывез, ресайзил до 1024
кстати про head swap на групповом фото вообще тишина, нигде не сказано как оно работает если в кадре 3 человека
@Joe Albanese на групповых head swap обычно не пробуют, потому что Blender не умеет несколько голов в одном проходе. это, кажется, общая дыра у всех публичных моделей
хм
автор явно не на проде это писал. таблица скоростей красивая, но реальные сервисы лагают в часы пик
вот, разобрался с ghost, на rtx 4060 пошло. результат на моём фото ужасный, волосы рваные
я ж говорю, кудри ломаются у всех. забил, вернулся к face swap
а где почитать политику хранения у magic hour? на сайте у них общая, конкретики по head swap я не нашёл
magic hour американский, под gdpr попадает кое-как, на запросы об удалении отвечают через раз
ну такое
короче, я для себя решил, локально через deepfacelab и не париться
если нужен один кадр, есть смысл попробовать roop, он легче чем dfl, но в статье его почему-то нет
roop же удалили с гитхаба год назад, нет? или вернули, давно не следил
форки живут, оригинал снесли
а что вы все про этику ничего, head swap чужого фото это вообще законно?
@Fear в рф напрямую закона нет, есть общая 152-фз по перс данным. серая зона, как обычно
вот это и пугает. сервис может молча обучаться на твоих фото и никто ничего не докажет
у sber ai в habr статье есть оговорка что для GHOST 2.0 датасет VoxCeleb2 + FFHQ, на пользовательских фото модель не дообучается. но это про модель, не про веб-сервис
согласен
vidmage 5-10 секунд это маркетинг. я замерял, у меня выходило 17 на простом портрете, на сложном за 30
а с очками работает? у меня все фото в очках
очки это отдельный ад, на face swap дужки часто пропадают
в HeSer paper про очки вообще ничего, видимо out of scope
бесит что нет никакого batch режима у бесплатных сервисов. 30 фото руками загружать
...
так а с очками и боковым ракурсом что в итоге делать?