🍵高级算法—AdaBoost算法

status
Published
type
Post
date
Jan 15, 2026
slug
aa-adaboost
summary
本文从博弈论的视角,证明了多个略优于随机猜测的弱分类器组合的模型可以收敛到强分类器,并对 AdaBoost 算法的工作原理给出严格数学证明。
tags
高级算法
category
课程笔记
icon
password
🗒️
这篇笔记来自南京大学 高级算法 (Fall 2025) 课程作业 3 的一道题。题解根据个人理解撰写,若有不准确或疏漏之处,敬请批评指正。

题目

Problem 8 In binary classification, we are given a set of data points and an unknown true classification . There is a family of classifiers where each , and a weak learning algorithm that, given any weight vector , returns a classifier such that
That is, the chosen classifier is correct on a weighted majority of the data.
(8a) Prove that there is a vector such that for every , we have
where is if , if and if .
(8b) Give an algorithm that outputs the vector , listing only its non-zero coordinates. The algorithm should use only standard computational steps, and calls to . Notice that the time complexity of the algorithm should not depend on .

解答

(8a)

将问题建模为一个零和游戏. 玩家 选择分类器的权重分布 , 策略空间为单纯形:
玩家 选择数据点的权重分布 , 策略空间为单纯形:
当分类器分类正确时, 收益 , 分类错误则收益 . 游戏中, 一个数据点的收益为所有分类器在该数据点收益的加权和. 设收益函数 表示总收益:
玩家 希望最大化收益, 玩家 希望最小化收益.
根据 Minimax Theorem, 博弈值 满足:
若玩家 先手, 选择 , 然后玩家 选择 . 玩家 的最优策略是将所有权重放在一个分类器上, 使得 最大:
根据弱学习算法的定义, 存在分类器 使得:
的加权正确率至少是 . 代入得:
因此, 对于任何 , 玩家 可以保证收益 .
若玩家 先手, 选择 , 然后玩家 选择 . 根据 Minimax Theorem, . 因此存在一个玩家 的最优策略 , 使得对于任意的 :
因此玩家 选择这个 . 当玩家 将权重集中在一个数据点 上时:
上式对任意 都成立. 选择 , 得:
同号:
证毕.

(8b)

计算 的算法 (AdaBoost):
输入: 数据集 , 真分类 , 弱学习算法
输出: 的非零坐标集合
流程:
  1. 初始化: 令 . 对所有 , 令 . ( 表示权重分布 的分量 在第 轮的值)
  1. 设参数
  1. :
    1. 调用弱学习器:
    2. 计算加权错误率:
      1. 其中 为指示变量.
    3. 设系数
    4. 更新权重分布并归一化:
      1. 其中 为使 的归一化常数.
    5. 加入 . 若 已在 中, 则累加系数:
  1. 返回
可以利用算法的输出 还原出 , 构建强分类器 :
为了证明算法的正确性, 需要证明两个定理:
  1. 定理 : 算法在 步之后收敛, 使得
  1. 定理 : 计算步数和调用 的次数均为
首先证明 : 算法在 步得到的强分类器 分类错误样本数为 .
引理 : 算法的任一轮 都有
证明 :
由弱学习算法的性质, 满足:
因此:
代入 得:
引理 证毕.
引理 : 设强分类器的训练误差
.
证明 :
设辅助函数 使得 , 即:
因此, 等价于 , 即 , 所以:
代入得:
对于 , 有:
根据 及函数 单调递增的性质:
所以:
引理 证毕.
由于 , 所以 , 根据引理 :
是整数, 只能有 . 定理 证毕.
算法的复杂度分析:
由于 , 因此调用 的次数为 , 属于 . 在循环内, 计算 和更新 都需要遍历数据集 , 因此时间复杂度均为 . 总计算步数为 , 属于 . 且算法的时间复杂度不依赖 . 定理 证毕.
 
Loading...

© Qiyue Zhang 2026