Задача на шесть пальцев 

Однажды в мою недолгую преподавательскую практику решила я поэкспериментировать с нейросетями. Вернее, велеть студентам что-нибудь нагенерить на семинаре. Так как вела я этножурналистику, то и задания у меня были с этническим компонентом. Накануне семинара попросила Midjourney и GigaChat создать мне какие-нибудь изображения на тему традиций народов России. И открыла портал в ад.

Помните, как несколько лет назад мы все иронизировали над тем, что у нейросетей жесткие проблемы с пальцами. Ну не мог ИИ их правильно нарисовать, то три нарисует, то шесть, то вообще пятку к ладошке приделает для большего визуального эффекта. Так вот, пальцы нейросети теперь вставляют куда надо и в каком нужно количестве. Но как бы мы не восхищались нейросетевым творчеством, ИИ не понимает этнику. Вообще. Не может нейросеть сгенерировать корректный костюм, игрушку или блюдо национальной кухни.

Проблема, говорят специалисты, в том, что ИИ нужно «скармливать» информацию, учить ее специально, показывать тысячи правильных примеров и столько же — неправильных. Звучит логично.

Несколько лет назад мне довелось пообщаться с дизайнером из Югры, которая создала нейросетевую коллекцию одежды с мотивами национальных орнаментов в декоре. Я, конечно, по-журналистски хотела упростить словесную конструкцию и написать, что ИИ теперь рисует национальные узоры. Дизайнер меня тогда поправила — не национальные узоры, а по мотивам. Она несколько месяцев старательно учила нейросеть, закидывала ее гигабайтами правильных изображений. Но даже тогда получилось «по мотивам», а не настоящий национальный орнамент.

Нейросети ориентируются на изображения в открытом доступе. По коренным малочисленным народам корректного иллюстративного ряда в интернете объективно недостаточно. Вот и кормится нейросеть, чем придется, создает ошибки на пустом месте. Просто от незнания.

Все верно. Но ведь и с русскими элементами ситуация не лучше. Готовясь к тому самому семинару, я попросила один из нейросетевых ботов на Midjourney сгенерировать дымковскую игрушку. Ту, что бренд Кировской области, которая у всей страны ассоциируется с Вяткой. Сгенерированная амазонка в кокошнике на коне изумила меня и до крайности поразила студентку, которая как раз из Вятки. Она этих дымковских игрушек с детства видела тысячи и уж точно знает, что никаких кокошников у барынь быть не должно, верхом они никогда не ездили, брючных костюмов не носили. В общем, миллион неточностей.

Вы снова скажете: «Ну и что?». В конце концов, не рухнет же мир из-за того, что нейросеть неправильно нарисовала игрушку. В привычном понимании, действительно, не рухнет. Но уже сейчас нейросети массово используются для генерации изображений в медиа.

Тысячи судебных исков от юрфирм к большим и малым редакциям, к сайтам администраций и различных учреждений привели к тому, что если нет в наличии гарантированного настоящего фото, на которое оформлены все подтверждающие документы, то сайт либо обойдется без картинки вообще, либо сгенерирует. Если тема касается этнотематики, то вероятность ошибки невероятно высока. Это то, что происходит сейчас.

Несложно предположить, как будут развиваться события дальше. Нейросетевых картинок по этнотематике будет становиться все больше — надо же чем-то материалы иллюстрировать, особенно если формат сайта жесткий и без картинки текст не выпустишь. Эти изображения будут попадать в сеть с сопроводительной информацией от вполне себе заслуживающих доверия источников. Нейросети будут воспринимать их как подходящий контент и учиться на нем. Учиться на своих ошибках, не понимая, что информация в изображении заведомо неверна.

Я много общалась со специалистами, занимающимися национальными костюмами для коренных малочисленных народов. От Камчатки до Мурманской области люди хватаются за головы и в один голос говорят о том, что очень часто национальные коллективы или сольные исполнители выходят на сцену в неправильных костюмах, тех, что не имеют никакого отношения к традициям. Откуда это пошло? Да все просто: люди загуглили внешний вид костюма в интернете и пошили такой же. Не у всех есть возможность пойти к консультанту по костюмам.

Дети в школах по всей стране изучают традиции своих народов. Хорошее дело. Но где они находят информацию? Правильно, в интернете. Где дымковские барыни ездят верхом на красных конях.

Лет 10 назад это все тоже было, но в меньшем количестве — сейчас объемы визуального контента растут, и он категорически неверный,  потому что нейросеть генерирует не копию, а усредненное изображение на основе тысяч схожих источников.

Национальная тема — не единственная. Спросите у станкостроителя, что он думает про изображения нейросетей и узнаете много новых слов. Есть что сказать на этот счет авиастроителям, судостроителям, специалистам по микроэлектронике. Пожалуй, нет ни одной ни одной отрасли, где нейросеть не ошибается при генерации изображений.

Но только этнотема особая, деликатная. Неверный орнамент на костюме — это не просто ошибка, а неправильно нарисованная картина мира, которая в народе формировалась веками.

Главный риск – чтобы выявить ошибку, нужно знать, как должно быть, — понимать, какой должна быть дымковская игрушка, настоящий орнамент и учпочмак. В мире, где сгенерированные изображения наступают со страшной силой, найти ту самую правдивую основу с каждым днем все сложнее.

Вера Черенева