WikiMini

Długa pamięć krótkotrwała

Długa pamięć krótkotrwała (ang. long short-term memory, LSTM[1]) – rodzaj rekurencyjnej sieci neuronowej (RNN) zaprojektowany z myślą o niwelowaniu problemu zanikających gradientów powszechnie występującego w tradycyjnych sieciach RNN[2]. Jego względna niewrażliwość na długość sieci stanowi jego przewagę nad innymi sieciami RNN, ukrytymi modelami Markowa i innymi metodami uczenia się sekwencji. Celem LSTM jest zapewnienie pamięci krótkotrwałej dla RNN, która może obejmować tysiące kroków czasowych (stąd „długa pamięć krótkotrwała”)[1].

Przypisy

[edytuj | edytuj kod]
  1. a b Sepp Hochreiter, Jürgen Schmidhuber, Long Short-Term Memory, „Neural Computation”, 9 (8), 1997, s. 1735–1780, DOI10.1162/neco.1997.9.8.1735, ISSN 0899-7667 [dostęp 2025-04-10].
  2. Sepp Hochreiter, Untersuchungen zu dynamischen neuronalen Netzen [online], Technical University Munich, Institute of Computer Science, 1991 (niem.).

Linki zewnętrzne

[edytuj | edytuj kod]