这个机器学习任务流程,可以抽象成函数:y=f(x),x 为输入,y 为理想的输出
于是乎,机器学习就可以看作是求函数 y=f(x)的最优解了
判断机器学习是否执行得好,有以下 2 个目标: -- 使训练错误率尽可能低(可以通过神经网络,函数逼近的方法) -- 使训练错误率与测试错误率的差距尽可能小(可以用正则化的方法)
欠拟合:训练错误率比较高
过拟合:测试错误率与训练错误率差距比较大