随笔记录

softmax 函数中的指数计算

孟宝亮 30
  1. 非负性,指数函数可以将任何实数映射到正数域,这确保了 softmax 的输出都是非负的,满足概率的基本性质。
  2. 放大差异:指数函数可以放大输入值之间的差异。会使得较大的值更大,较小值的相对更小。
    • 这种特性增强了输出向量中最大值与其他值之间的差异,有助于凸显分类问题中最可能的类别。
    • 在深度学习和神经网络的背景下,Softmax层通常跟交叉熵损失函数一起使用。指数函数能够加大梯度的差异,使得在网络反向传播过程中,误差信号更容易通过梯度更新传播至前面的层,特别是当预测错误时,能够提供强烈的信号指导权重调整。

回复

我来回复
  • 暂无回复内容