《人工智能算法设计与优化》测试题
1. 模型过于贴近历史数据,而难以预测新数据,这种现象称为( ) [单选题] *
欠拟合
过拟合(正确答案)
缺失值
噪音
2. 在不指定分类依据的情况下对客户细分,应采用的数据挖掘方法是( ) [单选题] *
回归
聚类(正确答案)
分类
时间序列
佛山科学技术学院分数线
3. sklearn的K均值算法中,用于确定聚类数量的参数是( ) [单选题] *
k
num
n_total
n_clusters(正确答案)
4. 哪个聚类算法是基于密度的( ) [单选题] *
K均值
DBSCAN(正确答案)
高斯混合聚类
双聚类
5. 生成较少的新变量来描述原来多个变量所携带的信息,这种技术是 [单选题] 拜佛礼仪*
交叉验证
公文标题字体主成分分析(正确答案)
数据离散化
分解
6. 主成分分析是最常用的降维方法,其函数名为( ) [单选题] *
pca()(正确答案)
svd()
svm()
matrix()
7. sklearn中,用于把历史数据分为训练集和测试集的函数是( ) [单选题] *
split
cross_validate
train_test_split(正确答案)
data_split
8. 决策树中不包含以下哪类结点( ) [单选题] *
根结点
内部结点
外部结点(正确答案)
叶结点
9. 评估分类模型时有个表格,主对角线给出了每一类正确分类的样本的个数,非对角线上的元素表示未被正确分类的样本个数,这个表格称为( ) [单选题] *
跟踪矩阵
评估矩阵
混淆矩阵(正确答案)
正确率矩阵
10. 以下哪种数据挖掘方法用于预测连续值( ) [单选题] *
回归(正确答案)
聚类
关联规则
分类
11. Scikit-Learn是基于Python的机器学习库,使用时需支付费用( ) [判断题] *
(正确答案)
12. 同一个数据挖掘任务往往需要建立多个模型并进行评估选优( ) [判断题] *
监控室管理制度
(正确答案)
13. 数据挖掘各流程执行一次即可,不需反复( ) [判断题] *
(正确答案)
14. K-均值算法中的K是指算法进行K次迭代( ) [判断题] *
(正确答案)
15. 数据降维属于无监督学习算法( ) [判断题] *
(正确答案)
16. 分类和回归属于有监督算法( ) [判断题] *
(正确答案)
17. r2用于度量回归模型的准确度,越接近于1越好( ) [判断题] *
(正确答案)
18. 为了评估分类模型的准确性,应该把历史数据分为训练集和测试集( ) [判断题] *
厂场
(正确答案)
19. 决策树的层次越多,则模型预测能力越强( ) [判断题] *
(正确答案)
20. 可以使用剪枝来减少决策树模型的过拟合 ( ) [判断题] *
呼和浩特大昭寺
(正确答案)