У ней внутре неонка

Как устроена нейросеть простыми словами. И чем она похожа на Пикник на обочине

— Вот, изволите видеть, так называемая эвристическая машина, — сказал старичок. — Точный электронно-механический прибор для отвечания на любые вопросы, а именно — на научные и хозяйственные.

— А что это у вас там за лампа? — подозрительно спросил Фарфуркис.

— А сейчас посмотрим, что она ответит… Вот, извольте, ответ.

Фарфуркис прочитал:

— «У мене внутре… гм… не… неонка». Гм. Что это такое — неонка?

— Айн секунд! — воскликнул изобретатель, выхватил листок и вновь подбежал к машинке. Дело пошло.

Стругацкие. Сказка о тройке

.

Общим местом в нынешних масс-медиа стало утверждение, что мы переживаем невиданный рассвет искусственного интеллекта и из этого последует множество ободряющих и пугающих последствий – как для каждого из нас, так и для общества в целом. Чтобы понять, так это или не так, давайте посмотрим на то, что большинство авторов статей обычно оставляет в стороне — что такое современный искусственный интеллект и как он работает.

Искусственный интеллект — это очень широкое понятие, и нам важно знать, что весь искусственный интеллект делится на два класса:  алгоритмический и машинное обучение.

Алгоритмический интеллект решает задачи по заранее установленным правилам. В определенном смысле автоматическая коробка передач автомобиля — это тоже искусственный интеллект, который выбирает передачу в зависимости от скорости, нажатия на педаль и других факторов. Для того, чтобы коробка передач могла это делать, мы написали некую программу и заложили в нее, и она этой программе следует.

В свое время такой подход пытались применять для множество задач: для игры в шахматы, для игры в го, для перевода текстов, для анализа математических уравнений, распознавания образов и множества другого. Что-то получилось — например в крестики-нолики на доске любого размера алгоритм всегда играет правильно. Но для большинства других историй это не сработало.

Все прекрасно помнят, как ужасно программы распознавали и переводили тексты еще пять лет назад. Совсем простые для человека задачи – например, отличить собаку от кошки – наотрез отказывались алгоритмизироваться.

Как результат – современные исследования искусственного интеллекта сконцентрировались вокруг методов машинного обучения. Они тоже очень старые, основные идеи появились ещё в Сороковых годах прошлого века, тем не менее, сейчас в них произошел большой прорыв.

Чтобы понять, почему и как, давайте сначала разберемся, как работает искусственный интеллект на основе нейросети. Нейросеть – это структура из нескольких слоев-столбиков (см. картинку).

В первый слой мы просто записываем входящие данные. Можно себе представить длинный вертикальный столбик в котором записаны цифры. Если мы смотрим на черно-белую картинку, то единичка означает светлый пиксель,  ноль – темный. Если это текст, то в каждую ячейку записывается код буквы, например единичка – это «а».

Поговорим о том, как нейросеть распознает рукописные цифры. Сначала мы на цифру накладываем квадрат и превращаем ее в черные и белые пиксели, которые и записываем в первый слой как нули и единички. Дальше мы рядом с первым столбиком ставим второй, и проделываем линейное преобразование. Слова этого пугаться не надо, мы просто берем числа из первого столбика, помножаем их на некоторые коэффициенты, складываем и размещаем в первой клеточке второго столбика. Точно так же делаем со второй клеткой, но коэффициенты там иные. И так до конца второго столбика.

Дальше мы ставим рядом третий столбик, и точно так же умножаем цифры из второго столбика и складываем их в следующий. Наконец, через какое-то количество слоев, обычно небольшое,  мы приходим к выходному столбику. У нас всего 10, и, значит, в выходном слое будет 10 ячеек.  Та ячейка, которая содержит самое большое число, и считается ответом – если оно в первой ячейке, то нейросеть видит ноль, если во второй – то единичку и так далее. Чем сильнее отличаются самое большое число от следующего по значению, тем достоверней ответ.

Таким образом нейросеть – это просто очень (на самом деле нереально) много коэффициентов, при помощи которых входной  ряд превращают в выходной путем школьной математики. Как же подбираются коэффициенты, чтобы, глядя на наши каракули, сеть бы (почти) всегда находила правильный ответ?

Кто определяет эти коэффициенты?  В общем случае, никто, сеть обучается этому сама, с помощью человека-учителя или без него. Сначала коэффициенты выставляются случайно. Потом нейросети показывают первую картинку, она проделывает все описанное и дает ответ. Если он верный, то ей  дают кусочек сахара (обычно – нет) и показывают следующую картинку.

Если нейросеть ошибается, то ее наказывают – коэффициенты немного меняют и повторяют всю эту процедуру по новой, пока не найдется правильный ответ. И так – до тех пор, пока процент угадывания перестанет расти.

Разумеется, все это — очень большое упрощение, но непринципиальное. Нейросеть — действительно простая математическая функция со множеством параметров, которые подбираются в процессе обучения на заранее размеченных наборах данных и ответах (или иным, более хитрым, способом). Наборами могут быть картинки, видео дорожного движения, рентгеновские снимки и все, что угодно.

Особенно удобно работать с текстами. Во-первых, имеется гигантский оцифрованный корпус, во-вторых, их не нужно размечать – нейросети просто дают кусок текста и заставляют угадывать, например, следующее слово. Именно поэтому нынешний прорыв ChatGPT, в первую очередь, ассоциируется с написанием тестов, переводами и тому подобным.  Никакой особой воли, или планов, или разума в этом, конечно, нет, интеллекта вроде бы тоже – и мир этому не захватить.

На этом можно было бы остановиться, но есть пара более сложных моментов, которые стоит упомянуть. Во-первых, скорее всего,  наш мозг устроен примерно так же – по сути, это узлы-нейроны, связанные проводками-аксонами. Обучение, разумеется, немного другое – цена ошибки отличается, но внешнее сходство поразительно.

Во-вторых, сети демонстрируют ряд феноменов, которые мы можем увидеть  у себя – например, есть наборы обучающих данных, которые приводят к абсолютно бесполезному в реальном тестировании результату.

В-третьих, то, что нейросеть по сути дела методом грубой силы решает задачи,  которые свойственны человеку,  наверное, заставит психологов и философов пересмотреть взгляд на наше мышление.

Существует довольно много философских подходов, говорящих, что мы достаточно просты. Наблюдаемая сложность нашего поведения определяется не сложностью нашего устройства, а необходимостью взаимодействия с другими людьми и внешним миром. Существует также популярное направление автоматизма мышления,  которое говорит о том, что наш мозг принимает решение за нас,  а сознание только рационализирует то, что уже случилось.

Еще одной проблемой нейросети является то, что мы не знаем, как она работает. Попытка в гигантском количестве коэффициентов выделить островки, ответственные за что-то конкретное человеческое – например, отличия ноликов от  палочек при распознавании цифр или за форму ушей при распознавании собаки от кошки, – пока практически не увенчалась успехом. Поэтому мы можем только догадываться, какой способ нейросеть  выберет для решения поставленных задач.

Это не фатально, но мы понимаем, что или мы должны объяснять нейросети принципы этичности,  или мы должны безусловно доверять ее выводам.

Можно рассмотреть простой пример. Например, вы — фармацевтическая компания и дали доступ своей нейросети к  рекламным объявлениям для того, чтобы повысить продажи таблеток от давления. Одним из способов (локальных минимумов, как говорят специалисты)  является большое количество постов о пользе таблеток, опасности гипертонии и эффективной борьбы с ней. Но в процессе обучения нейросеть может заметить,  что когда в масс-медиа есть много плохих новостей, люди испытывают стресс, давление у них подскакивает, они начинают есть больше бета-блокаторов и прочих таблеток. Вполне возможно, этот метод более эффективен – и именно туда нейросеть придет в процессе самообучения. 

Понятно, что все это не является фатальным.  Есть различные подходы к внешнему контролю над нейросетями. Можно заставить одну нейросеть контролировать другую,  есть направление этического обучения нейросетей и так далее.  Тем не менее, наверное, нейросети – это первая история человечества, когда мы получаем очень эффективный  инструмент, абсолютно не понимая, как он работает. Этакий Пикник на обочине с самыми разнообразными последствиями.

Виктор Достов,
кандидат физико-математических наук,
консультант ООН по вопросам и цифровизации,
соавтор телеграм-канала «Записки на рукавах» о будущем платежей, финтеха и криптовалют