четверг, 1 декабря 2011 г.

Возникновение естественных языков

Прохождение курса Machine Learning нанесло свой отпечаток, наложившись на известную информацию… В результате несколько статей.

Возможно и скорее всего, ряд вещей из них окажутся очевидными и известными. Но думаю во-первых, раскрытие вопроса со стороны ML поможет взглянуть на них с другой стороны, а во-вторых, позволит лучше понимать и формализовать подобные процессы.

Machine Learning

В двух словах. ML представляет собой один из обширных подразделов кибернетики, занимающийся вопросами машинного обучения. То есть, набор техник, алгоритмов и приемов, позволяющих создавать такие системы, которые можно обучить (или которые сами могут себя обучить) и в дальнейшем на основе обучения решать какие-либо задачи. Например обучиться на кликах пользователя спам/не спам и отсеивать спам и не спам. Сортировать галактики по различным классам, сами определяя данные классы и вычленяя особенные. Обучиться распознавать буквы-цифры с помощью нейронных сетей. Исходя из истории работы БД соптимизировать её параметры работы в дальнейшем. Прогнозировать цены на рынке. И мн.др..

Пример возникновения искусственного языка

Рассматриваемая статья — о роботах, которые сами придумали себе язык для общения.

После форвардинга данной новости о её значимости откликнулось несколько человек. Сейчас попробуем эту значимость раскрыть.

В принципе, данное явление не обязательно нужно моделировать роботами, это может быть и несколько общающихся программ.

Суть эксперимента

Было собрано несколько роботов, которые обладали неким обучающим себя поведением. Изначально в их конструкции имелся только алгоритм поведения, а факт обучения равен нулю. То есть, языковые конструкции как таковые изначально отсутствовали.

Далее роботы начали жить своей жизнью. В которой они общались между собой и закрепляли какое-либо поведение. Такое закрепление можно организовывать через любую обратную связь — подкрепление положительным/отрицательным стимулом, фиксация внешних событий и построение связей, присвоение признаков к какому-либо поведению и др..

В процессе происходило приблизительно следующее. Робот говорил случайную фразу F и ехал в точку А. Другой робот видел, что тот, кто сказал F, поехал в точку А. И закреплял связь между сказанной фразой F и точкой А. Далее если он хотел как-то ассоциировать действие с точкой А, он говорил это фразой F, или если это не подходило к фразе F, то говорил что-то другое.

В результате такого общения у них появился свой словарь. Например такой:

Здесь области для слов двух разных роботов. В словаре пять слов, с каждым из которых ассоциирована своя область. Кроме того, имеются слова, ассоциированные с направлениями:

Результаты

Пример возникновения языка с нуля
Прежде всего, возникновение языка продемонстрировано экспериментально. То есть, есть готовый пример, как он может образоваться с чистого листа. И что ничего сверхестественного и тайного в этом нет.
Продемонстрирован факт того, что роботы могут это сделать
В ряде случаев встречалось мнение, что только человек в состоянии придумывать слова и оперировать ими. В последующем выяснилось, что это могут делать даже муравьи. А сам язык для коммуникации не обязательно должен быть словесным или другим — это могут быть любые другие удобные средства, например жесты.
Пример показывает, как могут возникать языки
На основе этого можно экспериментально отслеживать различные закономерности в эволюции языков, а потом их проецировать на естественные языки и обнаруживать что-то новое. Такой вот готовый инструмент для изучения.
Кроме этого, насколько знаю, сейчас идут бурные обсуждения по поводу эволюции мемов, в частности и языков, и такой пример дает хорошее оружие в руках технических специалистов и кибернетиков, которые постепенно заменяют философские рассуждения гуманитариев.