泛化误差

上一节例子中谈到对泛化能力的评判可以定义为:

对于某函数,定义它的泛化误差(英文:generalization error),也称为泛化风险(英文:generalization risk)为:

其中为示性函数。

就是对泛化能力的评判,值越低说明越接近,即泛化能力强;反之,越大说明越远离,也就是泛化能力弱。或者说和上帝函数的距离的度量:

下面详细解释下每一项。

1 示性函数

示性函数是概率论中常用的函数,它的自变量为某个事件,定义为:

在泛化误差的定义中就是:

所以示性函数实际上就是将使得的点标注了出来。

2 期望

因为示性函数的特性,只需要对所有运用示性函数,然后将结果累加起来就可得到的误差。当然还要考虑到每个点有不同的概率,所以用概率来加权平均,其实就是求期望,因此定义的泛化误差(也就是的误差)为:

练习题 泛化误差的最大值为 0.5 1 当所有都使得时,泛化误差最大,即:

此时有:

所以最大值为 1 。

关注马同学
马同学高等数学
微信公众号:matongxue314