上一节例子中谈到对泛化能力的评判可以定义为:
对于某函数
,定义它的
泛化误差(英文:generalization error),也称为
泛化风险(英文:generalization risk)为:
其中为示性函数。
就是对泛化能力的评判,值越低说明越接近,即泛化能力强;反之,越大说明越远离,也就是泛化能力弱。或者说是和上帝函数的距离的度量:
下面详细解释下每一项。
示性函数是概率论中常用的函数,它的自变量为某个事件,定义为:
在泛化误差的定义中就是:
所以示性函数实际上就是将使得的点标注了出来。
因为示性函数的特性,只需要对所有运用示性函数,然后将结果累加起来就可得到和的误差。当然还要考虑到每个点有不同的概率,所以用概率来加权平均,其实就是求期望,因此定义的泛化误差(也就是和的误差)为:
练习题
泛化误差的最大值为
0.5
1
当所有都使得时,泛化误差最大,即:
此时有:
所以最大值为 1 。