Инженеры создали самообучающуюся систему, способную генерировать изображения человеческих лиц, подходящие для рекламы того или иного продукта. Система выделяет ключевые черты лиц, изображенных в рекламных объявлениях на разные темы, и творит новые «по образу и подобию». Достижение описано в научной статье, препринт которой опубликован на сайте arXiv.org Кристофером Томасом (Christopher Thomas) и Адрианой Ковашка (Adriana Kovashka) из Питсбургского университета.
Ученые поставили перед своим детищем амбициозную цель. Машина должна была стать специалистом по внешнему виду моделей на рекламных снимках. Нужно было выделить характерные особенности, присущие человеческим лицам в рекламе, скажем, косметики или одежды. Например, на губах женщины, рекламирующей косметику, наверняка будет помада. Далее компьютер должен был научиться создавать изображения таких лиц самостоятельно.
«В [системах] компьютерного зрения автокодеры работают, обрабатывая образ и обучаясь представлять это изображение в виде набора чисел, — цитирует Томаса издание TechXplore. — Затем вторая часть системы, декодер, учится брать эти цифры и воспроизводить по ним исходное изображение. Вы можете думать об этом почти как о способе сжатия [информации], в которой крупное изображение представлено несколькими числами».
Это очень сложная задача, поскольку, во-первых, рекламная продукция очень разнообразна, а во-вторых, количество исходных образцов недостаточно велико, чтобы полноценно обучить нейронную сеть. Поэтому исследователи решили помочь своему детищу.
Они сами составили список из признаков, которые должна анализировать сеть. Среди них оказалась, например, форма лица, оттенок кожи и наличие очков. Таким образом, система была запрограммирована проверять, есть ли на человеке очки, а не вынуждена самостоятельно уяснить факт существования такого аксессуара, анализируя множество изображений с очками и без.
Инженеры также перечислили темы, которым была посвящена реклама, ставшая материалом для обучения искусственного разума. В список вошли косметика, одежда, алкоголь, автомобили, спортивные товары и ещё 12 пунктов.
Система позволила собрать о них любопытные сведения. Например, в рекламе алкоголя, как правило, были задействованы улыбающиеся мужчины. Реклама одежды в целом похожа на рекламу косметики, но женщины в ней не так широко улыбаются и не так ярко красят губы. А вот в рекламе газировки, как правило, присутствуют улыбчивые пожилые люди.
«Приятная часть заключается в том, что как только мы создали модель для представления лица в виде ста чисел, если мы изменим некоторые из этих чисел и „расшифруем“ их, мы сможем изменить лицо, — говорит Томас. — Таким образом, мы можем трансформировать существующие лица, чтобы они выглядели [в основном] одинаково, но имели разные атрибуты, такие как очки, улыбка и так далее, просто изменив некоторые числа, которые использует наша модель для их представления».
Авторы сравнили свой метод генерации лиц с четырьмя аналогами. Более 60% добровольцев признали изображения, созданные новой системой, наиболее подходящими для соответствующих видов рекламы. Другие четыре метода, выступившие в качестве контрольных, набрали от 15 до 4 процентов голосов каждый.
Применение такой системы в будущем позволит создателям рекламных материалов экономить на съёмках, считают разработчики. Сделав несколько снимков, они смогут самостоятельно добавлять на них макияж, улыбку, аксессуары и так далее, и это потребует не кропотливого труда в графическом редакторе, а всего лишь нескольких команд, отданных «умной» программе.