2023年11月29日发(作者:)

《大数据概论》期末试卷含答案

1. 当前社会中,最为突出的大数据环境是 革选题]*

A. 互联网正确答案)

B. 物联网

C. 综合国力

D. 自然资源

2. 以下哪个不是大数据的特征()革选题]*

A. 价值密度低

B. 数据类型繁多

C. 访问时间短正确答案)

D. 处理速度快

3. 大数据的起源是()。革选题]*

A. 金融

B. 电信

C. 互联网正确答案)

D. 公共管理

4. 第三次信息化浪潮发生在哪一年前后()。革选题]*

A. 1980

B. 1995

C. 201正确答案)

D. 2019

5. 以下说法错误的是?()革选题]*

A. 大数据对传统行业有帮助

8.大数据是一种思维方式

仁大数据会带来机器智能

D.大数据仅仅是讲数据的体量大正确答案)

6. 下列单位不是数据单位的是()革选题]*

A. bit

B. NB正确答案)

C. GB

D. TB

7. ()是长期储存在计算机内、有组织的、可共享的数据集合。单选题]*

A. 数据库系统

B. 数据库正确答案)

C. 数据库管理系统

D. 数据结构

8. 数据库中存储的是()单选题]*

A. 数据

B. 数据模型

C. 数据及数据间的联系正确答案)

D. 信息

9. 以下哪一项属于非结构化数据。()革选题]*

A. 企业ERP数据

B. 财务系统数据

C. 视频监控数据正确答案)

D. 日志数据

10. HBase是分布式列式存储系统,记录按什么集中存放。()革选题]*

A. 列族正确答案)

B.

C.

D. 不确定

11. 哪一种数据采集方法被看作是软件传感器”。()革选题]*

A. 传感器

B. 系统日志正确答案)

C. 网络爬虫

D. 众包

12. 在关系数据库系统中,一个关系相当于()。革选题]*

A. 一张二维表正确答案)

B. 一条记录

C. 一个关系数据库

D. 一个关系代数

13. 大数据时代,数据使用的关键是 革选题]*

A. 数据收集

B. 数据存储

C. 数据分析

D. 数据再利用正确答案)

14. 以下哪一种数据采集方法是网站应用(如搜索引擎)主要的数据采集方式。

()革选题]*

A. 传感器

B. 系统日志

C. 网络爬虫正确答案)

D. 众包

15. 在数据集合中,每个信息不包含语义错误或相互矛盾的数据。这指的是()。

[单选题]*

A. 数据一致性正确答案)

B. 数据精确性

C. 数据完整性

D. 数据时效性

16. 数据清洗的方法不包括()。革选题]*

A. 缺失值处理

B. 噪声数据清除

C. 一致性检查

D. 重复数据记录处理正确答案)

17. 下列关于大数据的分析理念的说法中,错误的是()革选题]*

A. 在数据基础上倾向于全体数据而不是抽样数据。

B. 在分析方法上更注重相关分析而不是因果分析。

C. 在分析效果上更追究效率而不是绝对精确。

D. 在数据规模上强调相对数据而不是绝对数据。正确答案)

18. 以下哪一种数据采集方法是将搜集数据的任务是通过大量参与的用户来获取恰

当数据。()革选题]*

A. 传感器

B. 系统日志

C. 网络爬虫

D. 众包正确答案)

19. 与大数据密切相关的技术是()革选题]*

A. 蓝牙

B. 云计算正确答案)

C. 博弈论

D. wifi

20. 哪一种数据变换方法可以去除数据中的噪声波动,使数据平滑。()革选题]

*

A. 数据标准化

B. 数据编码

C. 数据归一化

D. 数据平滑正确答案)

21. 关系数据库的基本特征不包括哪一项。()革选题]*

A. 数据按一定的数据模型组织、描述和存储

B. 可为各种用户共享、冗余度较小、易扩展

C. 数据独立性较高

D. 存储非结构化数据正确答案)

22. 大数据应用需依托的新技术有()革选题]*

A. 大规模存储与计算

B. 数据分析处理

C. 智能化

D. 三个选项都是正确答案)

23. 大数据时代,数据使用的关键是()。单选题]*

A. 数据收集

B. 数据存储

C. 数据分析

D. 数据再利用正确答案)

24. 从关系中选取满足条件的元组,指的是()。革选题]*

A. 数据更新

B. 数据查询正确答案)

C. 数据插入

D. 数据删除

25. ()是一种数据库查询和程序设计语言,用于查询、更新和管理关系数据库系

统。革选题]*

A. SQL正确答案)

B. DDL

C. DML

D. DCL

26. SQL的非过程化特点指的是()。单选题]*

A. 可以独立完成数据库生命周期中的全部活动。

B. 使用时只需要告诉计算机做什么”,而不需要告诉它怎么做”。正确答案)

C. SQL能够独立地用于联机交互的使用方式。

D. 集数据定义(DDL,数据操纵(DML),数据控制(DCL)功能于一体。

27. 下列哪一项不是数据定义语句的动词()。革选题]*

A. CREATE

B. DROP

C. ALTER

D. DELETE正确答案)

28. 下列哪一项不是数据操纵语句的动词()。革选题]*

A. CREATE正确答案)

B. INSERT

C. UPDATE

D. DELETE

29. 事务之间是隔离的,每个事务都感觉不到系统中有其他事务在并发地执行,指

的是事务的哪一个特性()。革选题]*

A. 原子性

B. 一致性

C. 隔离性正确答案)

D. 持久性

30. 事务所包含的所有操作要么全部正确地反映在数据库中,要么全部不反映,指

的是事务的哪一个特性()。革选题]*

A. 原子性正确答案)

B. 一致性

C. 隔离性

D. 持久性

31. 位于用户与操作系统之间的一层数据管理软件,指的是()革选题]*

A. 数据库(正确答案)

B. 数据库管理系统

C. 数据库系统

D. 数据库应用系统

32. 分布式文件系统的特点()。革选题]*

A. 易扩充

B. 并行高

C. 可靠性高

D. 以上都是(正确答案)

33. 分布式系统中,关于分片的说法,错误的是()革选题]*

A. 分片是水平地将一个大的数据集划分成较小的、更易于管理的数据集的过程。

这些数据集叫做碎片。

B. 所有碎片都是相同模式,所有碎片集合起来代表完整的数据集。

C. 分片对客户端来说通常是不透明的;正确答案)

D. 分片允许处理负荷分布在多个节点上以实现水平可伸缩性。

34. 分布式系统中,关于复制的说法,错误的是()。革选题]*

A. 复制在多个节点上存储数据集的多个拷贝,被叫做副本。

B. 数据容错可以通过数据冗余来实现,数据冗余确保单个节点失败时数据不会丢

失。

C. 实现复制的两种方法:主从式复制、对等式复制。

D. 主从式复制适合于写请求密集的负载而不是读请求密集的负载。正确答案)

35. 在集群中一部分节点故障后,集群整体是否还能响应客户端的读写请求,指的

CAP定理中的哪一个特性()。单选题]*

A. 一致性(Consistency

B. 可用性(Availabilit正确答案)

C. 分区容错性(Partition tolerance

D. 以上都对

36. 关于NOSQL数据库的优点,说法错误的是()单选题]*

A. 灵活的数据模型,能处理非结构化/半结构化的大数据

B. 很好的容灾能力,数据能够被划分和备份

C. 成本昂贵,大多数是开源且容易实现正确答案)

D. 读写性能高

37. MongoDB数据库属于什么类型的NOSQL数据库。()单选题]*

A. 图数据库

B. 键值数据库

C. 文档数据库正确答案)

D. 列族数据库

38. 如果专注于构建关系图谱,如社交网络、推荐系统等,适合采用哪一类型的数

据库。()革选题]*

A. 键值对数据库

B. 文档数据库

C. 列族数据库

D. 图数据库正确答案)

39. 数据平滑采用的技术不包括()。革选题]*

A. 分箱

B. 回归

C. 聚类

D. 数据编码正确答案)

40. KNIME中结点的状态:结点上有三盏灯,就像红黄绿交通灯一样。当结点刚

被拖入工作区的时候,()灯亮起表示数据无法通过。单选题]*

A. 正确答案)

B.

C. 绿

»无法确定

41. Knime是基于Eclips的开源数据挖掘软件,它通过工作流的方式来完成数据仓

库以及数据挖掘中数据的()操作。革选题]*

A. 抽取转换加载正确答案)

B. 转换抽取加载

C. 抽取加载转换

D. 转换加载转换

42. Redi数据库属于文档类型的NOSQL数据库。判断题]*

正确答案)

43. K-means是一种典型的非监督学习算法。判断题]*

正确答案)

44. 反映数据分散性程度的最常用的一种指标是中位数。判断题]*

正确答案)

45. 颗粒度反映数据的精细化程度,越细化的数据,价值越高。判断题]*

正确答案)

46. 存储结构是指数据的组织形式或数据之间的联系。判断题]*

正确答案)

47. 学生关系中有学号,姓名,性别,年龄、专业等属性,其中学号是学生关系的

主码。学生选课关系中,包括学号,课程号和分数这三个属性。学号与课程号的组

合是学生选课关系的主码,学号、课程号分别都是外码。因此,这里的参照关系是

学生选课关系。判断题]*

正确答案)

48. 数据采集的过程要充分考虑其产生主体的物理性质,同时要兼顾数据应用的特

点。判断题]*

正确答案)

49. 大数据面对的信息价值密度都是比较高的。判断题]*

正确答案)

50. 大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软

件工具,在合理时间内管理、处理、并整理成为帮助企业经营决策更积极目的的资