LSTM(长短期记忆网络)是一种循环神经网络(RNN)的变体,常用于处理时间序列相关的任务。下面将简要介绍LSTM的数学推导和公式模型。
在训练一般神经网络模型时,通常用,其中W为权重,X为输入,b为常数。
LSTM包含三个门,每个都需要一次类似上面的计算,除此之外还需要计算当前状态。下面时详细计算公式。