KureiSersen site

对数几率回归

· Edwin.Liang

11+ex  \frac{1}{1+e^{-x}}\

模型表达式

  1. sigmoidsigmoid函数、激活函数、ss型函数 11+ex  \frac{1}{1+e^{-x}}\

补充

  1. 信息论自信息概念:自信息的期望被称为信息熵,信息熵用来衡量变量的不确定性,变量越不确定,信息熵越大。自信息表达式: I(x)=logbp(x) I(x)=-log_b\enspace p(x) {b=2时自信息的单位为bit,b=e时自信息的单位为nat}

  2. 信息熵表达式: E(I(x))=xp(x)logbp(x) E(I(x))=-\sum\limits_{x}^{}p(x)log_b\enspace p(x)

  3. 相对熵,又称KLKL散度,可以用于衡量两个分布的差异。假设真实模型为p(x)p(x),而我们求解得到的模型是q(x)q(x),那么我们就可以用p(x)p(x)q(x)q(x)的相对熵作为LOSSLOSS函数 DKL(pq)=xp(x)logbp(x)xp(x)logbq(x) D_{KL}(p||q) =-\sum\limits_{x}^{}p(x)log_b\enspace p(x)-\sum\limits_{x}^{}p(x)log_b\enspace q(x)

    1. 其中p(x)为常数,我们仅需使下述式子最小,即可获得最优模型 xp(x)logbq(x) -\sum\limits_{x}^{}p(x)log_b\enspace q(x)