研究生守则
研究生院开学了. 拖着大包小包的新生叫嚣乎东西, 隳突乎南北. 暑假期间门可罗雀的食堂重焕生机, 打饭师傅们脸上挂满了笑容. 作为过来人, 老夫沉静地观察并思考着. 今日突发功德心, 特将一年来积攒的经验归纳出来, 于新生有开知启蒙之功, 于老生收裨补阙漏之效, 于自己则权作备忘, 时时谨循, 善莫大焉. 是为研究生守则.
一. 在正确的时间做正确的事
尽管都知道早睡早起的益处, 但在研究生群体中夜猫子还是很多的. 也许你会说这是身不由己的, 课程和科研双管齐下, 不开夜车实在搞不定. 但是根据我的亲身体验, 事实往往并非如此, 至少我以前的熬夜常常是因为白天浪费太多时间浏览网页. 想在该睡的时候睡, 就要在该玩的时候玩, 该学的时候学. 做到这一点的诀窍在第二条守则中详述.
二. 不要被电脑左右
电脑依赖症现在是种流行病, 典型患者拥有QQ, MSN, GTalk, GReader, Twitter, 飞信, 微博, 人人, 豆瓣, 以及各大论坛BBS等等的全部或部分帐号, 一开机就尽数挂上, 然后穿梭其间, 连续刷屏, 乐不思蜀, 曾不知老板之将至. 很难想象这样的患者能够恪守第一条守则.
想要克服这一问题的同学可以读一读徐宥的真知灼见, 拔掉你的鼠标. 作为emacs用户, 我发现强制自己使用emacs中的文本浏览器w3m(而不是firefox)可以有效地戒除到处乱点链接的手瘾. 同时强烈推荐能够定时锁定计算机的软件workrave: 每到被锁定时我就有种当头棒喝的感觉, 于是提醒自己该干正事了. 此外, Linux用户还可以用cron设置定时关机, 这样就会记得合理分配时间.
三. 身体最重要
前面讲的是不要自我荒废, 另一方面, 搞科研也不是玩命, 不可太投入, 要讲究适可而止. 近的例如实验室的光哥去年年底由于过分用功曾大病一场, 长期只能喝粥. 远的例如孔金瓯教授的早逝: 大三的时候还曾亲聆謦欬, 大四就惊闻孔老师溘然长逝的噩耗. 生命真脆弱.
先贤早有教诲, 至圣先师孔子告诉我们中庸之道, “过犹不及”; 南华真人庄子告诉我们生命的珍贵, “吾将曳尾于涂中”. 结合研究生的实际, 该睡的觉一定要睡, 该吃的饭一定要吃 — 切忌吃太多, 食堂的东西吃多了会拉肚子的.
四. 不要提及失败
这里没有用习语“永不言败”, 因为还包含另一层意思, 即闲聊的时候也不要提及自己的失败经历. 研究生做课题碰壁是件再正常不过的事情, 这只说明学习还没到位. 大家都很忙, 做的东西又千差万别, 自己的难题只有自己能解决, 倒苦水没法换来帮助, 顶多换来同情, 也许还有鄙夷. 真的猛士总能凭自助从胜利走向胜利.
五. 忍耐
人生不如意事常十八九, 读研究生了应该明白这个道理, 也该明白有些东西凭一己之力很难加以改变. 也许别人加工资你没加; 也许别人放假你没放; 也许课题进展很不顺; 更扯一点, 也许你Google一下“周杰伦”都会撞墙. 想开一点, 这些都是小事情, 发发牢骚可以, 要发飙那就得三思了. 有功夫还是多修炼自己吧.
估计离散随机变量
的问题称为分类(classification)问题. 设
,
, 则分类问题需要找到映射
, 称为分类器. 可以使用错误率评估分类器的性能(风险函数可以有多种形式, 这里选用较为简单的错误率):

通常难以计算, 实践中可以用经验错误率(即训练错误率)近似. 若已知数据对
, 则经验错误率可表示为

在表达式
为真时取值1, 否则取值0.
低估了真实错误率
表示分类器的一个无穷集合, 我们
为一类集合
的总称,
可以是任何空间. 定义
阶增长函数(growth function, 也叫shatter coefficent):

函数计算集合中的元素个数. 选定
之后, 对任意
,
为
的一个子集. 这个式子要求这样的子集的最大个数, 显然与
的选择有关.
, 所以
. 如果
, 将满足条件的
, 那么称
的每个子集
都能写成
的形式.
; 否则定义
, 其中
为满足
的最大值, 即

种情况.
. 对于四点的情况,可以证明任一四元点集都无法被
. 这一结论可以推广:
维平面的VC维等于
.
. 每个分类器
与集合
唯一对应, 所以分类器的集合
的集合
. Vapnik和Chervonenkis的结果指出,

置信区间:
, 其中


时,

为风险函数(risk function),
为经验风险(empirical risk). 显然附加项是VC维的增函数: 分类器复杂程度增加, 经验风险减小, 但附加项增加.
. 定义分类器


与
应与
同号, 只需调整
, 则任一点
的距离公式为

,
应能使上面一个不等式的等号成立, 即
,
, 如图三所示. 于是得
, 进而平面

能够最大化两类样本的间距. Vapnik与Chervonenkis还证明最小化
的形式, 主要是为后续数学处理的方便. 为了解决这个带约束的最小化问题, 可以采用拉格朗日乘数法, 引入一组系数
. 经过推导得出原问题的一个等价形式:

称为“支持向量”, 因为分类平面
,
, 则优化问题变为


,
变换到三维空间:
.
, 使变换后的内积
. 这时只需将
代换原式中的
即可.
的形式并不重要, 只需知道
, 有

.