Linux 内核分析 之三:Linux内核启动函数start_kernel()的简单分析
说明 欧长坤 原创作品转载请注明出处 《Linux内核分析》MOOC课程http://mooc.study.163.com/course/USTC
Science and art, life in between.
欧长坤初次发表于『知乎』, 转载请注明出处。
这个问题问得很深刻,人们花了很长的时间才领悟到这个问题的答案,所以解释起来有点费力。我这里尝试性地做一个解释。 首先,我们需要搞明白三件事情:什么是一个学习问题、什么是风险最小化、什么是经验风险最小化归纳原则。
对于一个学习问题而言,给定了训练样本$(x_1,y_1),(x_2,y_2), … , (x_l,y_l)$,而训练的样本是根据联合分布$F(x,y)=F(x)F(y|x)$抽取的l个独立同分布的观测。学习问题就是从给定的函数集$f(x,\alpha),\alpha \in \Lambda$中选出能够最好地逼近训练样本的函数,换句话说,就是用最优函数估计样本背后蕴含的统计规律——用$f(x,\alpha)$估计$y$。 注意,$\Lambda$是参数集合,参数$\alpha\in\Lambda$并不一定必须是向量,可以是任意多抽象参数。