第一讲机器学习简介
第一讲测验
1、多选题:
机器学习可以用于哪些情形?
A: 人类无法解释的专业知识
B: 模型需要基于大量数据
C: 当人类专业知识不存在
D: 模型必须定制
答案: 人类无法解释的专业知识;
模型需要基于大量数据;
当人类专业知识不存在;
模型必须定制
2、多选题:
以下哪些属于监督学习?
A: 朴素贝叶斯
B: 支持向量机
C: 聚类
D: 决策树
答案: 朴素贝叶斯;
支持向量机;
决策树
3、多选题:
机器学习的类型有?
A: 半监督学习
B: 有监督学习
C: 无监督学习
D: 强化学习
答案: 半监督学习;
有监督学习;
无监督学习;
强化学习
4、判断题:
有监督学习是分类同时定性的,而无监督学习是先聚类后定性的。
A: 正确
B: 错误
答案: 正确
5、判断题:
半监督学习没标签数据的数量常常远大于有标签数据的数量。
A: 正确
B: 错误
答案: 正确
第二讲机器学习的评估方法
第二讲测验
1、多选题:
不平衡问题的领域有?
A: 医学诊断
B: 预测罕见事件
C: 检测欺诈
D: 预测故障/失效
答案: 医学诊断;
预测罕见事件;
检测欺诈;
预测故障/失效
2、判断题:
识别任务中,召回率是被预测为“正面”的测试数据中结果是正确的比例。
A: 正确
B: 错误
答案: 错误
第三讲回归分析
第三讲测验
1、单选题:
已知变量x与y正相关,且由观测数据算得x的样本平均值为3,y的样本平均值为3.5,则由该观测数据算得的线性回归方程可能是
A: y=0.4x+2.3
B: y=2x-2.4
C: y=-2x+9.5
D: y=-0.3x+4.4
答案: y=0.4x+2.3
2、单选题:
在两个变量的回归分析中,作散点图是为了
A: 直接求出回归直线方程
B: 直接求出回归方程
C: 根据经验选定回归方程的类型
D: 估计回归方程的参数
答案: 根据经验选定回归方程的类型
3、单选题:
下列两个变量之间的关系,哪个是函数关系
A: 学生的性别与数学成绩
B: 人的工作环境与健康状况
C: 正方形的边长与面积
D: 儿子的身高与父亲的身高
答案: 正方形的边长与面积
4、单选题:
在线性回归方程y=a+bx中,回归系数b表示
A: 当x=0时,y的平均值
B: x变动一个单位时,y的实际变动量
C: y变动一个单位时,x的平均变动量
D: x变动一个单位时,y的平均变动量
答案: x变动一个单位时,y的平均变动量
5、单选题:
若每一吨铸铁成本y(元)与铸件废品率x%建立的回归方程y=56+8x,下列说法正确的是
A: 废品率每增加1%,成本每吨增加64元
B: 废品率每增加1%,成本每吨增加8%
C: 废品率每增加1%,成本每吨增加8元
D: 废品率每增加1%,成本每吨增加56元
答案: 废品率每增加1%,成本每吨增加8元
6、单选题:
若根据x与y之间的一组数据求得两个变量之间的线性回归方程为y=a+bx,已知:数据x的平均值为2,数据y的平均值为3,则
A: 回归直线必过点(2,3)
B: 回归直线不一定过点(2,3)
C: 点(2,3)在回归直线上方
D: 点(2,3)在回归直线下方
答案: 回归直线必过点(2,3)
7、多选题:
下列结论正确的是
A: 函数关系是一种确定性关系
B: 相关关系是一种非确定性关系
C: 回归分析是对具有函数关系的两个变量进行统计分析的一种方法
D: 回归分析是对具有相关关系的两个变量进行统计分析的一种方法
答案: 函数关系是一种确定性关系;
相关关系是一种非确定性关系;
回归分析是对具有相关关系的两个变量进行统计分析的一种方法
8、多选题:
广义加性模型由什么特点
A: 可以自动对自变量和因变量进行非线性关系的建模
B: 非线性拟合可能会提高对因变量的预测精度
C: 在保持其他自变量不变的情形下可以分析每个自变量对因变量的单独效应
D: 非线性拟合可能会降低对因变量的预测精度
答案: 可以自动对自变量和因变量进行非线性关系的建模;
非线性拟合可能会提高对因变量的预测精度;
在保持其他自变量不变的情形下可以分析每个自变量对因变量的单独效应
9、多选题:
广义加性模型的拟合方法有
A: 自然样条
B: 光滑样条
C: 多项式回归
D: 局部回归
答案: 自然样条;
光滑样条;
多项式回归;
局部回归
10、多选题:
下列说法正确的是
A: 当变量之间的相关关系不是线性关系时,也能描述变量之间的相关关系
B: 当变量之间的相关关系不是线性关系时,也能直接用线性回归方程描述它们的相关关系
C: 把非线性回归化为线性回归为我们解决问题提供了一种方法
D: 当变量之间的相关关系不是线性关系时,可以通过适当的变换使其转换为线性关系
答案: 当变量之间的相关关系不是线性关系时,也能描述变量之间的相关关系;
把非线性回归化为线性回归为我们解决问题提供了一种方法;
当变量之间的相关关系不是线性关系时,可以通过适当的变换使其转换为线性关系
11、多选题:
为了考察两个变量x和y的线性相关性,甲、乙两个同学各自独立地做10次和15次实验,并且利用线性回归方法,求得回归直线分别为L1和L2。已知在两个人的实验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t,那么下列说法错误的是
A: 直线L1和L2有交点(s,t)
B: 直线L1和L2相交,但交点未必是点(s,t)
C: 直线L1和L2由于斜率相等,所以必定平行
D: 直线L1和L2必定重合
答案: 直线L1和L2相交,但交点未必是点(s,t);
直线L1和L2由于斜率相等,所以必定平行;
直线L1和L2必定重合
12、判断题:
线性假设是指自变量xj的变化对因变量y的影响与其他自变量的的取值无关。
A: 正确
B: 错误
答案: 错误
13、判断题:
“回归函数在边界区域是线性的”这个附加约束使自然样条在边界处产生更稳定的估计
A: 正确
B: 错误
答案: 正确
14、判断题:
在N-W方法中,核函数的带宽h越小,估计的回归函数曲线越光滑,h越大,估计的回归函数曲线波动越大。
A: 正确
B: 错误
答案: 错误
15、判断题:
广义加性模型在保持其他自变量不变的情形下可以分析每个自变量对因变量的单独效应。
A: 正确
B: 错误
答案: 正确
16、判断题:
回归函数刻画了平均意义下因变量与自变量的相依关系。
A: 正确
B: 错误
答案: 正确
17、判断题:
回归分析的研究对象是具有相关关系的变量。
A: 正确
B: 错误
答案: 正确
18、填空题:
回归分析的首要问题是
答案: 估计回归系数
19、填空题:
分段多项式回归的回归系数发生的临界点称为
答案: 结点
20、填空题:
自然样条是添加了 的样条回归:回归函数在边界区域是线性的。
答案: 边界约束
21、填空题:
做样条回归时,如果结点个数过 ,样条的回归曲线将非常曲折;反之,将过于平坦。
答案: 多
22、填空题:
在光滑样条回归的目标函数中, 的作用是使得回归函数尽可能拟合训练数据
答案: 损失函数
请发表您的评论