// MANUAL / TUTORIAL

Head swap и face swap: в чём принципиальная разница и какую технологию выбрать

Face swap подменяет только зону лица: глаза, нос, рот и контур щёк. Причёска, уши и форма черепа остаются от исходного фото. Head swap идёт дальше: заменяется голова целиком, вместе с волосами и силуэтом, а тело и фон сохраняются. Технически head swap сложнее, потому что после переноса головы в фоне образуется пустота (её достраивают через inpainting), и новая голова должна органично совпасть по цвету и освещению. Главный триггер для выбора head swap: у донора и реципиента сильно отличается причёска или форма головы. Когда причёски похожи, face swap справляется быстрее и проще.

Коротко: в чём главное отличие

Разница в том, что именно нейросеть забирает у донора и переносит на целевое фото. Face swap берёт только лицо. Head swap забирает всю голову.

Параметр Face swap Head swap
Область замены Только лицо: глаза, нос, рот, контур щёк Голова целиком: лицо, волосы, контур черепа
Что остаётся нетронутым Причёска, уши, шея, тело, фон Тело и фон (новая голова дорисовывается в существующее окружение)
Типичный результат Узнаваемое лицо донора с причёской и формой головы реципиента Полностью новая голова на исходном теле и фоне

Что такое face swap: как работает замена лица

Face swap – это автоматический перенос области лица с одного изображения на другое с сохранением мимики и условий освещения целевого кадра. Нейросеть не пересаживает кожу пиксель в пиксель, а реконструирует лицо донора так, чтобы оно повторяло выражение лица реципиента.

Сначала модель находит на лице ключевые точки (landmarks), по которым ориентируется при наложении:

  • глаза и брови,
  • нос и его кончик,
  • уголки рта и линия губ,
  • контур подбородка и щёк.

По данным Skillbox, нейросеть параллельно изучает освещение и ракурс, после чего синтезирует новое лицо. Под капотом обычно сочетаются CNN (анализ черт), GAN (генерация) и автоэнкодеры. В классической схеме на автоэнкодерах для двух людей обучается общий энкодер и два разных декодера; на инференсе декодеры меняют местами, и лицо донора оказывается на снимке реципиента с его мимикой, как описывает команда Sber AI на Habr.

Слабое место технологии заложено в её допущении. Face swap предполагает, что форма лица source и target примерно одинакова. Если у одного человека круглое лицо, а у другого узкое, нейросети нечем компенсировать разницу: на границе лица появляется шов, контур щёк выглядит чужеродно. То же касается причёсок. Голова донора как объёмный 3D-объект в кадр не попадает, перенесётся только плоский фронт лица.

Что такое head swap: как работает замена головы

Head swap заменяет на целевом фото всю голову: лицо, волосы и контур черепа. Тело, одежда и фон остаются от исходного снимка. В отличие от face swap, нейросети приходится решать две дополнительные задачи.

  • Inpainting фона: дорисовать участки за головой, которых на оригинале не было видно.
  • Цветовая адаптация: подогнать тон кожи и волос новой головы под освещение исходного фото.

Эти этапы реализованы в архитектуре HeSer, на которой базируется GHOST 2.0 от Sber AI. По описанию команды на Habr, модель состоит из двух модулей. Aligner реконструирует голову донора с помощью GAN: воссоздаёт её в нужном ракурсе и с нужной мимикой. Blender аккуратно вставляет полученную голову в целевое изображение, заодно достраивая фон и согласовывая цвета.

Чтобы Aligner понимал, что именно надо сохранить от донора, а что взять у реципиента, в GHOST 2.0 используются три энкодера:

  • портретный энкодер на ResNet кодирует identity по всей голове, включая причёску;
  • энкодер identity на ArcFace работает с кропом лица и хранит черты человека;
  • энкодер движения на MobileNetV2 описывает позу и мимику исходного кадра.

Самая сложная зона – волосы. Кудри, пушистые пряди и сильный контраст с фоном дают артефакты даже у топовых моделей: на bratuha.ru авторы прямо предупреждают, что такие участки могут смотреться неестественно.

Side-by-side comparison of two portrait photos generated from the same source image, the left frame labeled "FACE SWAP" showing a woman with the donor's facial features but the original short blond bob hairstyle preserved, the right frame labeled "HEAD SWAP" showing the same body and background but with the donor's full long curly dark-brown hair and head shape. Both subjects wear the identical white blouse against a soft beige studio backdrop. Even diffused softbox light from the front-left, neutral color temperature, gentle shadow falloff on the cheekbones. Editorial photographic style, clean and instructional, suitable for a tech explainer.

Сравнительная таблица: head swap vs face swap

Критерий Face swap Head swap
Область замены Только лицо Голова целиком (лицо + волосы + контур)
Что сохраняется у реципиента Причёска, форма головы, тело, фон Только тело и фон
Техническая сложность Ниже: достаточно перенести лицо Выше: добавляются inpainting фона и цветовая адаптация
Типичные артефакты Швы по контуру лица, особенно при разной форме головы Неестественные волосы, видимая граница на пушистых прядях
Скорость обработки ≈ 7 с (AI Face Swap, Fotomaster) ≈ 13 с (AI Headshot, Fotomaster); 5–10 с (VidMage)
Когда выбирать Похожие причёски, быстрые соцсети и мемы Разная форма головы или причёска, профессиональные фото

По данным Fotomaster, face swap обрабатывается заметно быстрее: в среднем 7 секунд против 13 на head swap. У VidMage заявленное время head swap составляет 5–10 секунд. Цифры понятны: head swap делает больше работы за один проход.

Когда использовать face swap, а когда head swap

Face swap уместен, когда от исходного фото нужно сохранить именно облик: причёску, головной убор, ракурс. Типичные сценарии:

  • быстрые мемы и реакции для соцсетей,
  • замена лица на групповом снимке, где остальное должно остаться нетронутым,
  • видеоконтент, где у героя и донора похожие причёски,
  • кейсы, в которых важна скорость, а не идеальный результат.

Head swap имеет смысл там, где причёска и форма головы донора важны и должны попасть в кадр:

  • корпоративные портреты, где нужно заменить голову сотрудника, не подгоняя его причёску под чужую;
  • восстановление старого семейного фото с повреждённой головой;
  • кино и реклама: дублёры в опасных сценах, омолаживающий эффект, работа с двойниками;
  • ситуации с сильно разной формой головы у исходного и целевого человека.

Простое правило выбора. Если причёски и форма головы у донора и реципиента похожи, берите face swap: он быстрее и реже даёт артефакты. Если различие явное (пышные кудри против короткой стрижки, круглое лицо против узкого), переходите на head swap. Тот же триггер возникает, когда нужен именно облик донора целиком, а не только его лицо.

Почему head swap технически сложнее: inpainting и цветовая адаптация

Face swap живёт на одном допущении: формы лица source и target одинаковы. Команда Sber AI прямо пишет на Habr, что при нарушении этого условия качество переноса падает, и именно поэтому появилась отдельная задача head swap.

Замена головы целиком разрушает целостность исходного кадра. Старая голова занимала какое-то место на фоне. Когда её убирают, в этой зоне остаётся прямоугольник без пикселей. Восстановить эти пиксели – задача inpainting. Модуль Blender в HeSer и GHOST 2.0 достраивает фон так, чтобы за новой головой не оставалось видимой границы или повторяющегося паттерна.

Вторая задача – цветовая адаптация. Донор был сфотографирован в одном освещении, реципиент в другом. Просто вставить голову нельзя: она будет светлее, теплее или холоднее, чем шея и плечи под ней. Blender перекрашивает кожу и волосы под условия исходного фона, чтобы граница между головой и шеей читалась как анатомическая, а не как монтажный шов.

Самое узкое место всё равно остаётся вверху. Волосы дают сложные контуры с прозрачностью. На контрастном фоне (например, тёмные кудри против белой стены) ИИ часто оставляет ореол или подрезает пряди ровной линией. Это видимый признак head swap, по которому изображение опознают как сгенерированное.

Clean infographic-style technical diagram showing two labeled processing blocks connected left-to-right by arrows. The first block reads "ALIGNER" with three small icons inside representing three encoders, captioned "ResNet portrait, ArcFace identity, MobileNetV2 motion." The second block reads "BLENDER" with two smaller labels "inpainting" and "color adaptation." Source images of a donor head and a target body photo enter from the left, a single composited result image exits to the right. Flat vector illustration on a light gray background, soft even ambient light without shadows, navy blue and warm orange accent colors. Crisp sans-serif labels in capital letters.

Инструменты: что попробовать прямо сейчас

Для head swap из доступного в России выделяются:

  • GHOST 2.0 от Sber AI – опенсорс, первая открытая модель переноса головы; для запуска нужны технические навыки;
  • bratuha.ru – веб-сервис, замена головы стоит 5 рублей за изображение;
  • VidMage – обработка одного фото за 5–10 секунд, загруженные снимки удаляются в течение двух часов;
  • Magic Hour – зарубежный сервис с поддержкой head swap для фото и видео.

Для face swap список длиннее. Из заметного:

  • DeepFaceLab – опенсорс, создан российским разработчиком Иваном Перовым, репозиторий на GitHub содержит подробные руководства;
  • Remaker AI и Pica AI – веб-инструменты для быстрой замены лица на фото;
  • FaceSwap от GPTunneL – интегрированный инструмент в экосистеме AI-сервисов с возможностью оживить результат другими моделями.

Политики хранения данных у этих инструментов разные. По собственной декларации, VidMage удаляет загруженные фото через два часа после обработки и не использует их для обучения ИИ. Facy.ai требует подтверждения, что у пользователя есть законное право на загружаемые изображения, и запрещает материалы с лицами младше 18 лет. Перед загрузкой чужих фото читайте условия каждого сервиса отдельно: они отличаются заметно.

Частые заблуждения

Миф: head swap и face swap – одно и то же

Технологии решают разные задачи. Face swap меняет только лицо, оставляя причёску и форму головы реципиента. Head swap забирает у донора всю голову целиком: лицо, волосы и силуэт. Разные задачи – разная архитектура (Aligner и Blender в head swap, автоэнкодеры в классическом face swap) и разная скорость обработки.

Миф: face swap и deepfake – синонимы

Face swap – конкретная технология переноса лица. Deepfake – зонтичный термин, который включает и синтез голоса, и изменение мимики, и генерацию полностью искусственных видео. На vc.ru обоснованно отмечают, что термин «face swap» точнее, а «deepfake» в медиа окрашен скорее негативно. Не каждый face swap является deepfake, и не каждый deepfake сделан через face swap.

Миф: знаменитый deepfake с Томом Крузом сделан только нейросетью

Это коллективный продукт. По разбору команды Sber AI на Habr, в основе сразу несколько факторов: исходная похожесть актёра-двойника на Круза, очень долгое обучение модели, большой объём референсного видео с лицом актёра и покадровая ручная постобработка. «Чистый» face swap нейросетью без подобранного двойника и ручной правки такого качества не даст.