Многослоен перцептрон

от Уикипедия, свободната енциклопедия
Направо към навигацията Направо към търсенето

Многослоен перцептрон (на английски: Multilayer Perceptron, MLP) е клас изкуствена невронна мрежа с право разпространение на сигнала (feedforward) и обратно разпространение на грешката (back propagation). Състои се от поне три слоя възли на мрежата. С изключение на входните възли (входове), всеки възел представлява неврон, който използва нелинейна активационна функция. Многослойният перцептрон използва техника на обучение с учител (supervised learning).[1][2]

Многослойните перцептрони са полезни в научноизследователската работа, поради способността им да решават задачи стохастично, което често позволява намирането на приблизителни („достатъчно добри“) решения на изключително сложни задачи (например апроксимация на фитнес функция). Те са универсални апроксиматори на функции, както показва теоремата на Цибенко, така че могат да се използват за създаването на математически модели на базата на регресионен анализ, като по-специално са подходящо средство за решаване на задачи за класификация.

Многослойните перцептрони са популярен инструмент на машинното обучение от 1980-те, като намират приложения в различни области като разпознаване на текст, разпознаване на образи, машинни преводи[3], но около края на века биват изместени от т.нар. машини с поддържащи вектори (support vector machines).[4] Интересът към мрежите с обратно разпространение се завръща след успеха на т.нар. дълбоко учене (deep learning).

Източници[редактиране | редактиране на кода]

  1. Rosenblatt, Frank. x. Principles of Neurodynamics: Perceptrons and the Theory of Brain Mechanisms. Spartan Books, Washington DC, 1961
  2. Rumelhart, David E., Geoffrey E. Hinton, and R. J. Williams. "Learning Internal Representations by Error Propagation". David E. Rumelhart, James L. McClelland, and the PDP research group. (editors), Parallel distributed processing: Explorations in the microstructure of cognition, Volume 1: Foundation. MIT Press, 1986.
  3. Neural networks. II. What are they and why is everybody so interested in them now?; Wasserman, P.D.; Schwartz, T.; Page(s): 10-15; IEEE Expert, 1988, Volume 3, Issue 1
  4. R. Collobert and S. Bengio (2004). Links between Perceptrons, MLPs and SVMs. Proc. Int'l Conf. on Machine Learning (ICML).
Криейтив Комънс - Признание - Споделяне на споделеното Лиценз за свободна документация на ГНУ Тази страница частично или изцяло представлява превод на страницата „Multilayer perceptron“ в Уикипедия на английски. Оригиналният текст, както и този превод, са защитени от Лиценза „Криейтив Комънс - Признание - Споделяне на споделеното“, а за съдържание, създадено преди юни 2009 година — от Лиценза за свободна документация на ГНУ. Прегледайте историята на редакциите на оригиналната страница, както и на преводната страница. Вижте източниците на оригиналната статия, състоянието ѝ при превода, и списъка на съавторите.