Head swap и face swap: в чём принципиальная разница и какую технологию выбрать
Face swap подменяет только зону лица: глаза, нос, рот и контур щёк. Причёска, уши и форма черепа остаются от исходного фото. Head swap идёт дальше: заменяется голова целиком, вместе с волосами и силуэтом, а тело и фон сохраняются. Технически head swap сложнее, потому что после переноса головы в фоне образуется пустота (её достраивают через inpainting), и новая голова должна органично совпасть по цвету и освещению. Главный триггер для выбора head swap: у донора и реципиента сильно отличается причёска или форма головы. Когда причёски похожи, face swap справляется быстрее и проще.
Коротко: в чём главное отличие
Разница в том, что именно нейросеть забирает у донора и переносит на целевое фото. Face swap берёт только лицо. Head swap забирает всю голову.
| Параметр | Face swap | Head swap |
|---|---|---|
| Область замены | Только лицо: глаза, нос, рот, контур щёк | Голова целиком: лицо, волосы, контур черепа |
| Что остаётся нетронутым | Причёска, уши, шея, тело, фон | Тело и фон (новая голова дорисовывается в существующее окружение) |
| Типичный результат | Узнаваемое лицо донора с причёской и формой головы реципиента | Полностью новая голова на исходном теле и фоне |
Что такое face swap: как работает замена лица
Face swap – это автоматический перенос области лица с одного изображения на другое с сохранением мимики и условий освещения целевого кадра. Нейросеть не пересаживает кожу пиксель в пиксель, а реконструирует лицо донора так, чтобы оно повторяло выражение лица реципиента.
Сначала модель находит на лице ключевые точки (landmarks), по которым ориентируется при наложении:
- глаза и брови,
- нос и его кончик,
- уголки рта и линия губ,
- контур подбородка и щёк.
По данным Skillbox, нейросеть параллельно изучает освещение и ракурс, после чего синтезирует новое лицо. Под капотом обычно сочетаются CNN (анализ черт), GAN (генерация) и автоэнкодеры. В классической схеме на автоэнкодерах для двух людей обучается общий энкодер и два разных декодера; на инференсе декодеры меняют местами, и лицо донора оказывается на снимке реципиента с его мимикой, как описывает команда Sber AI на Habr.
Слабое место технологии заложено в её допущении. Face swap предполагает, что форма лица source и target примерно одинакова. Если у одного человека круглое лицо, а у другого узкое, нейросети нечем компенсировать разницу: на границе лица появляется шов, контур щёк выглядит чужеродно. То же касается причёсок. Голова донора как объёмный 3D-объект в кадр не попадает, перенесётся только плоский фронт лица.
Что такое head swap: как работает замена головы
Head swap заменяет на целевом фото всю голову: лицо, волосы и контур черепа. Тело, одежда и фон остаются от исходного снимка. В отличие от face swap, нейросети приходится решать две дополнительные задачи.
- Inpainting фона: дорисовать участки за головой, которых на оригинале не было видно.
- Цветовая адаптация: подогнать тон кожи и волос новой головы под освещение исходного фото.
Эти этапы реализованы в архитектуре HeSer, на которой базируется GHOST 2.0 от Sber AI. По описанию команды на Habr, модель состоит из двух модулей. Aligner реконструирует голову донора с помощью GAN: воссоздаёт её в нужном ракурсе и с нужной мимикой. Blender аккуратно вставляет полученную голову в целевое изображение, заодно достраивая фон и согласовывая цвета.
Чтобы Aligner понимал, что именно надо сохранить от донора, а что взять у реципиента, в GHOST 2.0 используются три энкодера:
- портретный энкодер на ResNet кодирует identity по всей голове, включая причёску;
- энкодер identity на ArcFace работает с кропом лица и хранит черты человека;
- энкодер движения на MobileNetV2 описывает позу и мимику исходного кадра.
Самая сложная зона – волосы. Кудри, пушистые пряди и сильный контраст с фоном дают артефакты даже у топовых моделей: на bratuha.ru авторы прямо предупреждают, что такие участки могут смотреться неестественно.
Сравнительная таблица: head swap vs face swap
| Критерий | Face swap | Head swap |
|---|---|---|
| Область замены | Только лицо | Голова целиком (лицо + волосы + контур) |
| Что сохраняется у реципиента | Причёска, форма головы, тело, фон | Только тело и фон |
| Техническая сложность | Ниже: достаточно перенести лицо | Выше: добавляются inpainting фона и цветовая адаптация |
| Типичные артефакты | Швы по контуру лица, особенно при разной форме головы | Неестественные волосы, видимая граница на пушистых прядях |
| Скорость обработки | ≈ 7 с (AI Face Swap, Fotomaster) | ≈ 13 с (AI Headshot, Fotomaster); 5–10 с (VidMage) |
| Когда выбирать | Похожие причёски, быстрые соцсети и мемы | Разная форма головы или причёска, профессиональные фото |
По данным Fotomaster, face swap обрабатывается заметно быстрее: в среднем 7 секунд против 13 на head swap. У VidMage заявленное время head swap составляет 5–10 секунд. Цифры понятны: head swap делает больше работы за один проход.
Когда использовать face swap, а когда head swap
Face swap уместен, когда от исходного фото нужно сохранить именно облик: причёску, головной убор, ракурс. Типичные сценарии:
- быстрые мемы и реакции для соцсетей,
- замена лица на групповом снимке, где остальное должно остаться нетронутым,
- видеоконтент, где у героя и донора похожие причёски,
- кейсы, в которых важна скорость, а не идеальный результат.
Head swap имеет смысл там, где причёска и форма головы донора важны и должны попасть в кадр:
- корпоративные портреты, где нужно заменить голову сотрудника, не подгоняя его причёску под чужую;
- восстановление старого семейного фото с повреждённой головой;
- кино и реклама: дублёры в опасных сценах, омолаживающий эффект, работа с двойниками;
- ситуации с сильно разной формой головы у исходного и целевого человека.
Простое правило выбора. Если причёски и форма головы у донора и реципиента похожи, берите face swap: он быстрее и реже даёт артефакты. Если различие явное (пышные кудри против короткой стрижки, круглое лицо против узкого), переходите на head swap. Тот же триггер возникает, когда нужен именно облик донора целиком, а не только его лицо.
Почему head swap технически сложнее: inpainting и цветовая адаптация
Face swap живёт на одном допущении: формы лица source и target одинаковы. Команда Sber AI прямо пишет на Habr, что при нарушении этого условия качество переноса падает, и именно поэтому появилась отдельная задача head swap.
Замена головы целиком разрушает целостность исходного кадра. Старая голова занимала какое-то место на фоне. Когда её убирают, в этой зоне остаётся прямоугольник без пикселей. Восстановить эти пиксели – задача inpainting. Модуль Blender в HeSer и GHOST 2.0 достраивает фон так, чтобы за новой головой не оставалось видимой границы или повторяющегося паттерна.
Вторая задача – цветовая адаптация. Донор был сфотографирован в одном освещении, реципиент в другом. Просто вставить голову нельзя: она будет светлее, теплее или холоднее, чем шея и плечи под ней. Blender перекрашивает кожу и волосы под условия исходного фона, чтобы граница между головой и шеей читалась как анатомическая, а не как монтажный шов.
Самое узкое место всё равно остаётся вверху. Волосы дают сложные контуры с прозрачностью. На контрастном фоне (например, тёмные кудри против белой стены) ИИ часто оставляет ореол или подрезает пряди ровной линией. Это видимый признак head swap, по которому изображение опознают как сгенерированное.
Инструменты: что попробовать прямо сейчас
Для head swap из доступного в России выделяются:
- GHOST 2.0 от Sber AI – опенсорс, первая открытая модель переноса головы; для запуска нужны технические навыки;
- bratuha.ru – веб-сервис, замена головы стоит 5 рублей за изображение;
- VidMage – обработка одного фото за 5–10 секунд, загруженные снимки удаляются в течение двух часов;
- Magic Hour – зарубежный сервис с поддержкой head swap для фото и видео.
Для face swap список длиннее. Из заметного:
- DeepFaceLab – опенсорс, создан российским разработчиком Иваном Перовым, репозиторий на GitHub содержит подробные руководства;
- Remaker AI и Pica AI – веб-инструменты для быстрой замены лица на фото;
- FaceSwap от GPTunneL – интегрированный инструмент в экосистеме AI-сервисов с возможностью оживить результат другими моделями.
Политики хранения данных у этих инструментов разные. По собственной декларации, VidMage удаляет загруженные фото через два часа после обработки и не использует их для обучения ИИ. Facy.ai требует подтверждения, что у пользователя есть законное право на загружаемые изображения, и запрещает материалы с лицами младше 18 лет. Перед загрузкой чужих фото читайте условия каждого сервиса отдельно: они отличаются заметно.
Частые заблуждения
Миф: head swap и face swap – одно и то же
Технологии решают разные задачи. Face swap меняет только лицо, оставляя причёску и форму головы реципиента. Head swap забирает у донора всю голову целиком: лицо, волосы и силуэт. Разные задачи – разная архитектура (Aligner и Blender в head swap, автоэнкодеры в классическом face swap) и разная скорость обработки.
Миф: face swap и deepfake – синонимы
Face swap – конкретная технология переноса лица. Deepfake – зонтичный термин, который включает и синтез голоса, и изменение мимики, и генерацию полностью искусственных видео. На vc.ru обоснованно отмечают, что термин «face swap» точнее, а «deepfake» в медиа окрашен скорее негативно. Не каждый face swap является deepfake, и не каждый deepfake сделан через face swap.
Миф: знаменитый deepfake с Томом Крузом сделан только нейросетью
Это коллективный продукт. По разбору команды Sber AI на Habr, в основе сразу несколько факторов: исходная похожесть актёра-двойника на Круза, очень долгое обучение модели, большой объём референсного видео с лицом актёра и покадровая ручная постобработка. «Чистый» face swap нейросетью без подобранного двойника и ручной правки такого качества не даст.