Ученые продемонстрировали, что нейронной сеть можно обучить демонстрировать «систематическую композиционность», ключевую часть человеческого интеллекта.
Нейронные сети, разновидность искусственного интеллекта, теперь могут объединять концепции, как это делает человек.
С 1980-х годов некоторые ученые-когнитивисты утверждают, что нейронные сети, разновидность искусственного интеллекта (ИИ), не являются жизнеспособными моделями разума. Все из-за того, что их архитектура не способна уловить ключевую особенность человеческого мышления. Теперь, благодаря обучению, они могут обрести эту человеческую способность.
В новом исследовании ученые протестировали модели искусственного интеллекта и людей-добровольцев, используя вымышленный язык с такими словами, как «dax» и «wif». Эти слова соответствовали либо цветным точкам, либо функции, которая определенным образом манипулировала порядком этих точек в последовательности. В итоге, последовательность слов определяла порядок появления цветных точек.
Итак, получив бессмысленную фразу, ИИ и люди должны были выяснить основные «грамматические правила», определяющие, какие точки подходят к словам.
Участники-люди воспроизводили правильные последовательности точек примерно в 80% случаев. Когда им это не удавалось, они совершали постоянные ошибки. Например, они полагали, что слово представляет собой одну точку, а не функцию, которая перетасовывает всю последовательность точек.
После тестирования семи моделей ИИ ученые остановились на методе MLC — meta-learning for compositionality. Он позволяет нейронной сети практиковаться в применении различных наборов правил к вновь выученным словам, а также дает обратную связь о том, верно ли она применяет установленные правила.
Обученная MLC нейронная сеть соответствовала или превосходила результаты людей в этих тестах. А когда исследователи добавили данные об распространенных ошибках людей, модель ИИ допустила те же ошибки, что и люди.
Также ученые сравнили MLC с двумя моделями на основе нейронных сетей от OpenAI. Они обнаружили, что в тесте точек и MLC, и люди показали гораздо лучшие результаты, чем модели OpenAI. MLC также справился с дополнительными задачами, которые включали интерпретацию письменных инструкций и значений предложений.
Исследование опубликовано в журнале Nature.
Изображение: Flickr | Сведения о лицензии. Автор: Liam Huang