2024年2月9日发(作者:)
一选择题
1、关于MNIST,下列说法错误的是(C)。
A.是著名的手写体数字识别数据集
B.有训练集和测试集两部分
C.训练集类似人学习中使用的各种考试试卷
D.测试集大约包含10000个样本和标签
2、以下选项中,机器学习算法真正用来“学习”的数据是(B)
A.验证集
B.训练集
C.测试集
D.超参数集
3、对于神经网络的说法,下面正确的是:()
A增加神经网络层数,可能会增加测试数据集的分类错误率
B减少神经网络层数,总是能减小测试数据集的分类错误率
C增加神经网络层数,总是能减小训练数据集的分类错误率
4预测分析中将原始数据分为训练数据集和测试数据集等,其中训练数据集的作用在于(C)。
A、用于对模型的效果进行无偏的评估
B、用于比较不同模型的预测准确度
C、用于构造预测模型
D、用于选择模型
5、什么样的数据不适合用深度学习()
A、数据集太小
B、数据集太大
C、数据集没有局部相关性
D、数据集局部相关性极强
6、学习没有标签的数据集的机器学习方法是?()
A、监督学习
B、无监督学习
C、半监督学习
D、强化学习
7、可以通过(C)数据处理手段实现去除图像冗余部分。
A.图像归一化
B.均值
C.白化
D.图像灰度化
8、图像归一化的主要作用是(A)。
A.将图像按照一定的标准形式进行标准化处理,使图像能具有抵抗几何变换的能力
B.去除图像噪声部分
C.改正图像采集系统的系统误差和仪器位置的随机误差
D. 矩阵维数下降,运算速度大幅度提高,并且梯度信息仍然保留
9、在tensorflow 开发环境下,可以使用(A)方法来完成图像灰度化的操作。
. rgb_to_grayscale()
B. _to_hsv()
C. _to_yiq()
D. _to_yuv()
10、One-Hot编码,又称为一位有效编码,主要是采用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候只有一位有效。它主要是用来解决类别型数据的离散值问题的。假定对篮球,足球,乒乓球,羽毛球进行独热编码,其中篮球的编码结果为(A)。
A.[1 0 0 0]
B.[0 1 0 0]
C.[0 0 1 0]
D.[0 0 0 1]
11、LabelEncoder 编码对不连续的数字或者文本进行编号,将其转换成连续的数值型变量。假定对["paris", "paris", "tokyo", "amsterdam"]进行labelencoder编码,那么得到的结果应该是(A)。
A.[1 1 2 0]
B.[0 0 1 2]
C.[1 1 2 0]
D.[2 2 0 1]
12、全连接神经网络简称是(C)。
13、全连接神经网络一般由(B)几部分组成。
A.输入层,池化层,输出层
B.输入层,隐藏层,输出层
C.输入层,输出层
D.输入层,卷积层,输出层
二填空题
1、MNIST是一个非常著名的手写数字数据集,由纽约大学教授Yann LeCun负责构建。
2、TensorFlow2也提供了自动下载MNIST数据集函数_data。
3、数字图像本质就是一个二维数组。
4、TensorFlow2中的MNIST数据存储是以npz格式存储,因此是无法再电脑用图片编辑器软件打开的。
5、在MNIST数据集中返回训练集的形状为(60000, 28, 28)的三维数组。
6、全连接神经网络对单个数据要求输入数据为向量,而不是二维数组。因此,需要将2828的二维数组转换为一维数组。
7、 TensorFlow2中保存的MNIST原始数据的数据类型是uint8,但是在后续的处理中肯定是会涉及到浮点数操作,因此需要将这些数据转换为浮点数。
8、MNIST的标签编码方式是序列化唯一。
9、MNIST数据集中图片的像素值是0-255范围内的,但是不同的图片的像素分布差别很大。小像素值很容易在忽略的过程中被忽略掉,这对模型最终的性能影响是非常大的。为了解决此类问题,可以通过对像素值的缩放来缓解。常见的一种方法就是图像归一化,即将所有像素的值缩放到0-1范围内。
10、手写数字识别是一个3层的全连接神经网络模型。
11、分类任务的评估标准一般采用准确率来进行评估。
12、启动训练,程序会自动在脚本所在的目录下创建一个checkpoint文件夹,所有的权重模型都保存在该文件夹下。
13、通过加载指定权重实现在模型训练程序完全停止后进行模型测试,或者在测试中间保存的某一个模型的性能。
三、综合题
Cifar-10 数据集一个十分接近普适物体的彩色图像数据集,它一共包含10 个类别的RGB 彩色图片:飞机( airplane )、汽车( automobile )、鸟类( bird )、猫( cat )、鹿( deer )、狗( dog )、蛙类( frog )、马( horse )、船( ship )和卡车( truck )。其中每个图片的尺寸为32 × 32 ,每个类别有6000个图像,数据集中一共有50000 张训练图片和10000 张测试图片。
在本章我们需要做的就是构建DNN网络模型,在cifar-10数据集上训练,得到一个比较好的识别cifar-10数据集的模型。
任务要求:
任务1 cifar-10数据集
任务2 搭建并训练cifar-10识别模型
任务3 cifar-10识别模型性能验证


发布评论