2024年5月29日发(作者:)
1、2012年7月,为挖掘大数据的价值,阿里巴巴集团在管理层设立()一职,负责
全面推进“数据分享平台”战略,并推出大型的数据分享平台。
A首席数据官
B.首席科学家
C.首席执行官
D.首席架构师
2、整个 MapReduce的过程大致分为Map、 Shuffle、 Combine、()?
A. Reduce
C. Clean
D. Loading
3、在Spak的软件栈中,用于交互式查询的是
A. SparkSQL
D. Spark Streaming
4、在数据量一定的情况下, MapReduce是一个线性可扩展模型,请问服务器数量
与处( )理时间是什么关系?
A数量越多处理时间越长
B.数量越多处理时间越短
C.数量越小处理时间越短
D.没什么关系
5、下列选项中,不是 kafka适合的应用场景是?
A.日志收集
B.消息系统
C.业务系统
D.流式处理
6、大数据的多样性使得数据被分为三种数据结构,那么以下不是三种数据结构之
一的是
A.结构化数据
B.非结构化数据
C.半结构化数据
D.全结构化数据
7、下列选项中,不是人工智能的算法中的学习方法的是?
A.重复学习
B.深度学习
C.迁移学习
D.对抗学习
8、自然语言处理难点目前有四大类,下列选项中不是其中之一的是
A.机器性能
B.语言歧义性
C.知识依赖
D.语境
9、传統的机器学习方法包括监督学习、无监督学习和半监督学习,其中监督学习
是学习给定标签的数据集。请问标签为离散的类型,称为分类,标签为连续的类型,
称为什么?
A.给定标签
B.离散
C.分类
D.回归
10、中国移动自主研发、发布的首个人工智能平台叫做()
A.九天
B. OneNET
C.移娃
D.大云
11、HDFS中 Namenodef的 Metadata的作用是?
A.描述数据的存储位置等属性
B.存储数据
C.调度数据
D.
12、电信行业的客户关系管理中,客服中心优化可以实现严重问题及时预警,请问
是用的什么技术实现的?
A大数据技术
B.互联网技术
C.游戏技术
D.影像技术
13、随着闭源软件在数据分析领域的地盘不断缩小,老牌IT厂商正在改变商业模
式,向着什么靠拢?
A.闭源
B.开源
C.独立
D.封闭
14、以下不是非结构化数据的项是?
A.图片
B.音频
C.数据库二维表数据
D.视频
15、以下数据单位换算错误的是?
=1024B
B. 1GB=1024MB
=1000GB
D. 1MB=1024KB
16、下列选项中,不是Flume的特点的是?
A.可靠性
B.集中式架构
C.可扩展性
D.可管理性
17、BP神经网络模型拓扑结构不包括
A.输入层
B.隐层
C.翰出层
D.显层
18、以下哪个不是语音识别的范畴?
A.语音听写
B.语音台成
C.语音转写
D.语音唤醒
19、以下哪个场景可以称为大数据场景?
A.故宫游客人
B.故宫门票收入
C.美团APP的定位信息
D.文章内容
20、2011年5月是哪家全球知名咨询公司在《 Big data: The next frontier for
innovation, competition and productivity》研究报告中指出,数据已经渗透
到每一个行业和业务职能之中,逐渐成为重要的生产因素的?
A.比尔恩门
B.麦肯锡
C.扎克伯格
D.乔图斯
21、下列选项中,哪项是分布式文件存储系统?
B. Flume
C. Kafka
D. Zookeeper
22、下列选项中,正确描述Flume对数据源的支持的是
A.只能使用HDFS数据源
B.可以配置数据源
C.不能使用文件系统
D.不能使用目录方式
23、机器学习研究如何通过计算的手段,利用经验来改善系统自身的性能,请问机
器学习利用数据训练出什么?
A.模型
B.表结构
C.结果
D.报表
24、下列选项中,不是人工智能的算法中的学习方法的是
A.重复学习
B.深度学习
C.迁移学习
D.对抗学习
25、语音识别产品体系有四部分,下列哪项不是体系之一?
A.语音合成
B.语音播放
C.语音识别
D.语义理解
26、今年,大数据分析将出现革命性的新方法,从前的很多算法和基础理论可能会
产生理论級别的突破。而哪项技术将继续成为大数据智能分析的核心技术
A机器学习
B.智能物流
C.脑科学
D.智能终端
27、以下哪个不属于大数据在电信行业的数据商业化方面的应用
A.精准广告
B.网络管理
C.营销洞察
D.大数据检测和决策
28、RDD是由多个什么组成?
B. computer
C. Action
D. Transformation
29、下列选项中,不是大数据的一部分的是?
A.海量计算
B.大量数据管理
C.数据分析
D.单机计算
30、属于“人造智能”,具有意识,达到或超越人类智慧水平的人工看能称为()
A.高人工智能
B.低人工智能
C.强人工智能
D.弱人工智能
31、 mapreduce计算模型适用于哪种任务?
A.多线程处理
B.有关联的行处理
C.批处理
D.实时数据变化处理
32、当前世界产生的数据总量的单位是?
B. ZB
33、IBM提出的大数据5V特征包括更大( Volume)、更快( Velocity)、更多
Variety)、更值钱(Value)和()
A.更有效
B.更充分
C.更真实( Veracity)
D.更直观
34、 Spark.是基于什么的迭代计算框架?它适用于需要多次操作特定数据集的应
用场合。需要反复操作的次数越多,所需读取的数据量越大,受益越大,数据量小
但是计算密集度较大的场合,受益就相对较小
A.内存
B.硬盘
C.磁带
D.显卡
35、下列选项中,不是 kafka适合的应用场景是?
A.日志收集
B.消息系统
C.业务系統
D.流式处理
36、数据采集的基本步骤(ETL)中不包括哪项?
A.抽取转换
B.加载
C.计算
D.
37、以下哪种学习方法不属于人工智能算法?
A.迁移学习
B.对抗学习
C.强化学习
D.自由学习
38、语音识别常用的应用有四个,下列不是常用应用的是?
A聊天
B.拨号
C.导航
D.设备控制
39、下列选项中,哪项是由谷歌开发的人工能箅法框架?
A. Kafka
B. Tensorflow
C. Caffe
D. Torch
40、“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优
化能力来适应()、高増长率和多样化的信息资产。
A.海量
B.少数
C.小量
D.结构化
41、MPP是指
A.大规模并行处理系统
B.受限的分布式计算模型
C.集群计算资源管理框架
D.分布式计算编程框架
42、 Hadoop是()年诞生的?
43、在 Spark的软件栈中,用于流计算的是?
A. GraphX
B. Mllib
C. Spark Streaming
D. SparkSQL
44、以下数据量可以称为大数据的是
A. 100MB
C. 100PB
45、人工智能通过输入的图片,解析出图片的内容,这种技术叫什么?
A.图片识别
B.语音识别
C.自动驾驶
D.消费金融
46、IBM的()是第一个在国际象棋上战胜人类
人工智能计算机。
A. Alphago
B. 深蓝
C.图灵机模型
D.深度学习机器人
47、下列选项中,不是人工智能的基础设施的是?
服务器
服务器
C.专用芯片
D.游戏显卡
48、以下哪个不属于大数据在电信行业的应用?
A数据商业化
B.物流网络
C.企业运营管理
D.客户关系管理
49、客服中心是运营商和客户接触较为频繁的通道,我们可以利用()在后端给客
服中心建立庞大的知识库,供接线员们使用帮忙他们快速精准的找到答案。
A.大数据技术
B.客户画像
C.客户状态
D.客户心情
50、IBM提出的大数据5V特征包括()、更快( velocity)、更多( Variety)、更
值钱(Value)和更真实( Veracity)
A.更有效
B.更大(Volume)
C.更充分
D.更直观
51、Fume采用了三层架构,分别为 agent, collector和()
B. storage
C. Shuffle
52、 Hadoop2系列版本中默认的HDFS的block是多大?
A32MB
D. 16MB
53、工信部官网正式发布大数据产业“一三五“发展规划是在哪一年
54、BP神经网络的学习规则是?
A.梯度上升法
B.梯度下降法
C.梯度提升法
D.梯度曲线法
55、中国移动研发了智能客服问答机器人(),使业务流程自动化,更加智能的回答
用户解决业务咨询、业务办理、流量查询等问题。
A.精灵
B.阿尔法蛋
C.小度
D.移娃
56、对抗学习中两个网络互相竟争,一个负责生成样本,那么另一个负责做什么?
A.判别样本


发布评论