当先锋百科网

首页 1 2 3 4 5 6 7

LSTM(长短期记忆网络)是一种循环神经网络(RNN)的变体,常用于处理时间序列相关的任务。下面将简要介绍LSTM的数学推导和公式模型。

在训练一般神经网络模型时,通常用s=f(W^{T}X+b),其中W为权重,X为输入,b为常数。

LSTM包含三个门,每个都需要一次类似上面的计算,除此之外还需要计算当前状态。下面时详细计算公式。