设置一个屏蔽矩阵 M,然后我们
其中 M 在需要屏蔽的位置上设置为负无穷
M=(−∞−∞00−∞−∞00−∞−∞00−∞−∞00)M = \begin{pmatrix} -\infty & -\infty & 0 & 0 \\ -\infty & -\infty & 0 & 0 \\ -\infty & -\infty & 0 & 0 \\ -\infty & -\infty & 0 & 0 \end{pmatrix}M=−∞−∞−∞−∞−∞−∞−∞−∞00000000
这样就可以在 softmax 之后把那几个区域都设置为 0 了