《人工智能算法设计与优化》测试题
1. 模型过于贴近历史数据,而难以预测新数据,这种现象称为( ) [单选题] *
欠拟合 |
过拟合(正确答案) |
缺失值 |
噪音 |
回归 |
聚类(正确答案) |
分类 |
时间序列 |
佛山科学技术学院分数线 |
3. sklearn的K均值算法中,用于确定聚类数量的参数是( ) [单选题] *
k |
num |
n_total |
n_clusters(正确答案) |
4. 哪个聚类算法是基于密度的( ) [单选题] *
K均值 |
DBSCAN(正确答案) |
高斯混合聚类 |
双聚类 |
5. 生成较少的新变量来描述原来多个变量所携带的信息,这种技术是 [单选题] 拜佛礼仪*
交叉验证 |
公文标题字体主成分分析(正确答案) |
数据离散化 |
分解 |
6. 主成分分析是最常用的降维方法,其函数名为( ) [单选题] *
pca()(正确答案) |
svd() |
svm() |
matrix() |
7. sklearn中,用于把历史数据分为训练集和测试集的函数是( ) [单选题] *
split |
cross_validate |
train_test_split(正确答案) |
data_split |
8. 决策树中不包含以下哪类结点( ) [单选题] *
根结点 |
内部结点 |
外部结点(正确答案) |
叶结点 |
9. 评估分类模型时有个表格,主对角线给出了每一类正确分类的样本的个数,非对角线上的元素表示未被正确分类的样本个数,这个表格称为( ) [单选题] *
跟踪矩阵 |
评估矩阵 |
混淆矩阵(正确答案) |
正确率矩阵 |
10. 以下哪种数据挖掘方法用于预测连续值( ) [单选题] *
回归(正确答案) |
聚类 |
关联规则 |
分类 |
11. Scikit-Learn是基于Python的机器学习库,使用时需支付费用( ) [判断题] *
对 |
错(正确答案) |
12. 同一个数据挖掘任务往往需要建立多个模型并进行评估选优( ) [判断题] *
监控室管理制度
对(正确答案) |
错 |
13. 数据挖掘各流程执行一次即可,不需反复( ) [判断题] *
对 |
错(正确答案) |
14. K-均值算法中的K是指算法进行K次迭代( ) [判断题] *
对 |
错(正确答案) |
15. 数据降维属于无监督学习算法( ) [判断题] *
对(正确答案) |
错 |
16. 分类和回归属于有监督算法( ) [判断题] *
对(正确答案) |
错 |
17. r2用于度量回归模型的准确度,越接近于1越好( ) [判断题] *
对(正确答案) |
错 |
18. 为了评估分类模型的准确性,应该把历史数据分为训练集和测试集( ) [判断题] *
对(正确答案) |
错 |
19. 决策树的层次越多,则模型预测能力越强( ) [判断题] *
对 |
错(正确答案) |
20. 可以使用剪枝来减少决策树模型的过拟合 ( ) [判断题] *
对(正确答案) |
错 |
发布评论