Нейрокомпьютерные системы

       

Рекуррентная сеть Эльмана


Рекуррентная сеть Эльмана характеризуется частичной рекуррентностью в форме обратной связи между скрытым и входным слоем, реализуемой с помощью единичных элементов запаздывания

Рекуррентная сеть Эльмана
. Обобщенная структура этой сети представлена на рис. 3.

Каждый скрытый нейрон имеет свой аналог в контекстном слое, образующем совместно с внешними входами сети входной слой. Выходной слой состоит из нейронов, однонаправленно связанных только с нейронами скрытого слоя, подобно сети RMLP. Обозначим внутренний вектор возбуждения сети

Рекуррентная сеть Эльмана

(в его состав входит также единичный сигнал поляризации), состояния скрытых нейронов -

Рекуррентная сеть Эльмана
, а выходные сигналы сети -
Рекуррентная сеть Эльмана
. При таких обозначениях входной вектор сети в момент
Рекуррентная сеть Эльмана
имеет форму

Рекуррентная сеть Эльмана

Веса синаптических связей первого (скрытого) слоя сети обозначим

Рекуррентная сеть Эльмана
, a второго (выходного) слоя -
Рекуррентная сеть Эльмана
. Если взвешенную сумму
Рекуррентная сеть Эльмана
-го нейрона скрытого слоя обозначить
Рекуррентная сеть Эльмана
, а его выходной сигнал -
Рекуррентная сеть Эльмана
, то

Рекуррентная сеть Эльмана

Рекуррентная сеть Эльмана

увеличить изображение
Рис. 3.  Структура сети Эльмана

Веса

Рекуррентная сеть Эльмана
образуют матрицу
Рекуррентная сеть Эльмана

синаптических связей скрытого слоя, а

Рекуррентная сеть Эльмана
- функция активации
Рекуррентная сеть Эльмана
-го нейрона этого слоя. Аналогично можно обозначить взвешенную сумму
Рекуррентная сеть Эльмана
-го нейрона выходного слоя
Рекуррентная сеть Эльмана
, а соответствующий ему выходной сигнал сети -
Рекуррентная сеть Эльмана
. Эти сигналы описываются формулами

Рекуррентная сеть Эльмана

В свою очередь, веса

Рекуррентная сеть Эльмана
образуют матрицу
Рекуррентная сеть Эльмана
, описывающую синаптические связи нейронов выходного слоя;
Рекуррентная сеть Эльмана
- функция активации
Рекуррентная сеть Эльмана
-го нейрона выходного слоя.


Для прогноза временных рядов могут применяться статистические методы. В этом случае должна быть построена динамическая модель данных (например, регрессионная модель) изучаемого явления. Для простейших задач такая модель может быть построена известными методами. Однако для практических задач, примеры которых приведены выше, построение подобной динамической модели представляет собой сложную аналитическую задачу. Эти приложения связаны обычно не со скалярными, а с векторными временными рядами. Например, в финансовой сфере прогноз котировок товара зависит от вектора динамических данных, которые включают цены открытия и закрытия торговой сессии, среднюю и максимальную цены торговой сессии, суммарный уровень заявок, валютные курсы и пр.

В том случае, когда адекватной математической модели изучаемых временных рядов не существует, удобным инструментом для решения задачи прогноза является нейросетевой экстраполятор динамических данных.

Задача прогноза векторного временного ряда ставится следующим образом:

  • задана реализация временного ряда
    Рекуррентная сеть Эльмана
    ,
    Рекуррентная сеть Эльмана
    , на интервале времени
    Рекуррентная сеть Эльмана
    с постоянным интервалом дискретности
    Рекуррентная сеть Эльмана
    ;
  • требуется построить оценку значения временного ряда (обычно одной его координаты) в момент времени
    Рекуррентная сеть Эльмана
    , где
    Рекуррентная сеть Эльмана
    - заданное время прогноза.


Из логических соображений или путем статистического анализа имеющейся реализации можно установить, сколько предшествующих значений относительно произвольного текущего момента времени
Рекуррентная сеть Эльмана
определяюще связаны с прогнозируемым значением. Это означает, что если представить прогнозируемое значение
Рекуррентная сеть Эльмана
Рекуррентная сеть Эльмана
-ой координаты вектора
Рекуррентная сеть Эльмана
как функцию его предшествующих измерений:

Рекуррентная сеть Эльмана


то выбор значения
Рекуррентная сеть Эльмана
устанавливает "память" экстраполятора. Значение
Рекуррентная сеть Эльмана
определяет также входной вектор для нейронной сети, которая строится для решения задачи прогноза. Размерность этого вектора равна
Рекуррентная сеть Эльмана
.

Таким образом, задача прогноза данных на нейронной сети сведена к задаче воспроизведения функции многих переменных
Рекуррентная сеть Эльмана
,
Рекуррентная сеть Эльмана
по данным обучающей выборки.


Содержание раздела