Радиальная нейронная сеть

Использование в разложении

$Радиальная нейронная сеть$

базисных функций, где

$Радиальная нейронная сеть$

- это количество обучающих выборок, недопустимо также и с практической точки зрения, поскольку обычно количество этих выборок очень велико, и в результате вычислительная сложность обучающего алгоритма становится чрезмерной. Решение системы уравнений (1) размерностью

$Радиальная нейронная сеть$

при больших значениях

$Радиальная нейронная сеть$

становится затруднительным. Так же, как и для многослойных сетей, необходимо редуцировать количество весов, что в этом случае сводится к уменьшению количества базисных функций. Поэтому отыскивается субоптимальное решение в пространстве меньшей размерности, которое с достаточной точностью аппроксимирует точное решение. Если ограничиться

$Радиальная нейронная сеть$

базисными функциями, то аппроксимирующее решение можно представить в виде

$Радиальная нейронная сеть$

(3)

где

$Радиальная нейронная сеть$

, а

$Радиальная нейронная сеть$

- множество центров, которые необходимо определить. В особом случае, если принять

$Радиальная нейронная сеть$

, можно получить точное решение

$Радиальная нейронная сеть$

Чаще всего в качестве радиальной функции применяется функция Гаусса. При размещении ее центра в точке

$Радиальная нейронная сеть$

она может быть определена в сокращенной форме как

$Радиальная нейронная сеть$

(4)

В этом выражении

$Радиальная нейронная сеть$

- параметр, от значения которого зависит ширина функции.

Полученное решение, представляющее аппроксимирующую функцию в многомерном пространстве в виде взвешенной суммы локальных базисных радиальных функций (выражение (3)), может быть интерпретировано радиальной нейронной сетью, представленной на рис. 2 (для упрощения эта сеть имеет только один выход), в которой

$Радиальная нейронная сеть$

определяется зависимостью (4). Это сеть с двухслойной структурой, в которой только скрытый слой выполняет нелинейное отображение, реализуемое нейронами с базисными радиальными функциями. Выходной нейрон, как правило, линеен, а его роль сводится к взвешенному суммированию сигналов, поступающих от нейронов скрытого слоя. Вес

$Радиальная нейронная сеть$

, как и при использовании сигмоидальных функций, представляет поляризацию (порог), вводящую показатель постоянного смещения функции.

Рис. 2. Обобщенная структура радиальной сети

Полученная архитектура радиальных сетей имеет структуру, аналогичную многослойной структуре сигмоидальных сетей с одним скрытым слоем.
Роль скрытых нейронов в ней играют базисные радиальные функции, отличающиеся своей формой от сигмоидальных функций. Несмотря на отмеченное сходство, сети этих типов принципиально отличаются друг от друга. Радиальная сеть имеет фиксированную структуру с одним скрытым слоем и линейными выходными нейронами, тогда как сигмоидальная сеть может содержать различное количество слоев, а выходные нейроны бывают как линейными, так и нелинейными. У используемых радиальных функций может быть весьма разнообразная структура. Нелинейная радиальная функция каждого скрытого нейрона имеет свои значения параметров

$Радиальная нейронная сеть$

, тогда как в сигмоидальной сети применяются, как правило, стандартные функции активации с одним и тем же для всех нейронов параметром

$Радиальная нейронная сеть$

. Аргументом радиальной функции является эвклидово расстояние образца

$Радиальная нейронная сеть$

от центра

$Радиальная нейронная сеть$

, а в сигмоидальной сети - это скалярное произведение векторов

$Радиальная нейронная сеть$

.

Содержание раздела