《人工智能算法设计与优化》测试题

1. 模型过于贴近历史数据，而难以预测新数据，这种现象称为（） [单选题] *

欠拟合

过拟合(正确答案)

缺失值

噪音

2. 在不指定分类依据的情况下对客户细分，应采用的数据挖掘方法是( ) [单选题] *

回归

聚类(正确答案)

分类

时间序列

佛山科学技术学院分数线

3. sklearn的K均值算法中，用于确定聚类数量的参数是（） [单选题] *

num

n_total

n_clusters(正确答案)

4. 哪个聚类算法是基于密度的（） [单选题] *

K均值

DBSCAN(正确答案)

高斯混合聚类

双聚类

5. 生成较少的新变量来描述原来多个变量所携带的信息，这种技术是 [单选题] 拜佛礼仪*

交叉验证

公文标题字体主成分分析(正确答案)

数据离散化

分解

6. 主成分分析是最常用的降维方法，其函数名为（） [单选题] *

pca()(正确答案)

svd()

svm()

matrix()

7. sklearn中，用于把历史数据分为训练集和测试集的函数是（） [单选题] *

split

cross_validate

train_test_split(正确答案)

data_split

8. 决策树中不包含以下哪类结点（） [单选题] *

根结点

内部结点

外部结点(正确答案)

叶结点

9. 评估分类模型时有个表格，主对角线给出了每一类正确分类的样本的个数，非对角线上的元素表示未被正确分类的样本个数，这个表格称为（） [单选题] *

跟踪矩阵

评估矩阵

混淆矩阵(正确答案)

正确率矩阵

10. 以下哪种数据挖掘方法用于预测连续值（） [单选题] *

回归(正确答案)

聚类

关联规则

分类

11. Scikit-Learn是基于Python的机器学习库，使用时需支付费用( ) [判断题] *

对

错(正确答案)

12. 同一个数据挖掘任务往往需要建立多个模型并进行评估选优( ) [判断题] *

监控室管理制度

对(正确答案)

错

13. 数据挖掘各流程执行一次即可，不需反复（） [判断题] *

对

错(正确答案)

14. K-均值算法中的K是指算法进行K次迭代( ) [判断题] *

对

错(正确答案)

15. 数据降维属于无监督学习算法( ) [判断题] *

对(正确答案)

错

16. 分类和回归属于有监督算法( ) [判断题] *

对(正确答案)

错

17. r2用于度量回归模型的准确度，越接近于1越好( ) [判断题] *

对(正确答案)

错

18. 为了评估分类模型的准确性，应该把历史数据分为训练集和测试集( ) [判断题] *

厂场

对(正确答案)

错

19. 决策树的层次越多，则模型预测能力越强( ) [判断题] *

对

错(正确答案)

20. 可以使用剪枝来减少决策树模型的过拟合 ( ) [判断题] *

呼和浩特大昭寺

对(正确答案)

错

《人工智能算法设计与优化》测试题

发布评论取消回复

最近发表

热门文章

标签列表