科多大数据培训
全国24小时免费热线
15328019568
联系QQ
3048661160
开班时间
当前位置:首页 > 学习资讯 >

大数据培训资讯:大数据面试真题第六期Hadoop&大数据基础

前五期科妹为大家整理了大数据相关的编程语法基础问答面试真题,这一期开始就要正式进入大数据的部分啦。要从事大数据行业,首先得了解大数据的基本概念和特点,所以科妹选择

前五期科妹为大家整理了大数据相关的编程语法基础问答面试真题,这一期开始就要正式进入大数据的部分啦。要从事大数据行业,首先得了解大数据的基本概念和特点,所以科妹选择了大数据基础知识和大数据最突出的特点——分布式的典型代表Hadoop作为第六期的主角。快来检测一下吧。科多大数据每天都会更新大数据培训资讯哦,感兴趣的小伙伴不要错过。

 

大数据培训资讯:大数据面试真题第六期Hadoop&大数据基础

(共30分,每题2分)

1.大数据环境下的隐私担忧,主要表现为

A. 个人信息的被识别与暴露

B. 用户画像的生成

C. 恶意广告的推送

D. 病毒入侵

2.支撑大数据业务的基础是

A. 数据科学

B. 数据应用

C. 数据硬件

D. 数据人才

3.下列论据中,能够支撑“大数据无所不能”的观点的是

A. 互联网金融打破了传统的观念和行为

B. 大数据存在泡沫

C. 大数据具有非常高的成本

D. 个人隐私泄露与信息安全担忧

4.大数据时代,数据使用的关键是

A. 数据收集

B. 数据存储

C. 数据分析

D. 数据再利用

5.下列关于大数据的分析理念的说法中,错误的是

A. 在数据基础上倾向于全体数据而不是抽样数据

B. 在分析方法上更注重相关分析而不是因果分析

C. 在分析效果上更追究效率而不是绝对精确

D. 在数据规模上强调相对数据而不是绝对数据

6.下列关于计算机存储容量单位的说法中,错误的是

A. 1KB<1MB<1GB

B. 基本单位是字节(Byte)

C. 一个汉字需要一个字节的存储空间

D. 一个字节能够容纳一个英文字符

7.下列关于网络用户行为的说法中,错误的是

A. 网络公司能够捕捉到用户在其网站上的所有行为

B. 用户离散的交互痕迹能够为企业提升服务质量提供参考

C. 数字轨迹用完即自动删除

D. 用户的隐私安全很难得以规范保护

8.当前社会中,最为突出的大数据环境是

A. 互联网

B. 物联网

C. 综合国力

D. 自然资源

9.下列关于舍恩伯格对大数据特点的说法中,错误的是

A. 数据规模大

B. 数据类型多样

C. 数据处理速度快

D. 数据价值密度高

10.美国海军军官莫里通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。这体现了大数据分析理念中的

A. 在数据基础上倾向于全体数据而不是抽样数据

B. 在分析方法上更注重相关分析而不是因果分析

C. 在分析效果上更追究效率而不是绝对精确

D. 在数据规模上强调相对数据而不是绝对数据

11.大数据的最显著特征是

A. 数据规模大

B. 数据类型多样

C. 数据处理速度快

D. 数据价值密度高

12.智能健康手环的应用开发,体现了(   )的数据采集技术的应用

A. 统计报表 

B. 网络爬虫

C. API接口

D. 传感器

13.数据清洗的方法不包括

A. 缺失值处理

B. 噪声数据清除

C. 一致性检查

D. 重复数据记录处理

14.下列关于数据重组的说法中,错误的是

A. 数据重组是数据的重新生产和重新采集

B. 数据重组能够使数据焕发新的光芒

C. 数据重组实现的关键在于多源数据融合和数据集成

D. 数据重组有利于实现新颖的数据模式创新

15.下列哪项通常是集群的最主要瓶颈

A. CPU

B. 网络

C. 磁盘 IO

D. 内存

 

 

答案解析:

1.A,用户画像并不包含用户的隐私信息,其他两个选项则和用户无关

2.B

3.A

4.D,大数据的思想就是WORM,即Write-Once-Read-Many

5.D

6.C,汉字需要双字节

7.C

8.A,hadoop的设计初衷就是处理互联网数据

9.D,大数据的特点之一是:数据价值密度低

10.B

11.A

12.D

13.D

14.A

15.C,首先集群的目的是为了节省成本,用廉价的 pc 机,取代小型机及大型机。小型机和大型机有什么特点?

           1)cpu 处理能力强

           2)内存够大

           3)网络是一种稀缺资源,但是并不是瓶颈。

           4)由于大数据面临海量数据,读写数据都需要 io,然后还要冗余数据,hadoop 一般备 3份数据, IO 就会打折扣,集群的瓶颈也不可能是A和D

 

大数据培训资讯:大数据面试真题第六期Hadoop&大数据基础

(共40分,每题4分)

1.当前大数据技术的基础包括

A. 分布式文件系统

B. 分布式并行计算

C. 关系型数据库

D. 分布式数据库

2.下列哪项可以作为集群的管理

A. Puppet

B. Pdsh

C. Cloudera Manager

D. Zookeeper

3.配置机架感知的下面哪项正确

A. 如果一个机架出问题,不会影响数据读写

B. 写入数据的时候会写到不同机架的 DataNode 中

C. MapReduce 会根据机架获取离自己比较近的网络数据

4.在网络爬虫的爬行策略中,应用最为基础的是

A. 深度优先遍历策略

B. 广度优先遍历策略

C. 高度优先遍历策略

D. 大站优先策略

5.列关于脏数据的说法中,正确的是

A. 格式不规范

B. 编码不统一

C. 与实际业务关系不大

D. 数据不完整

6.数据再利用的意义在于

A. 挖掘数据的潜在价值

B. 实现数据重组的创新价值

C. 利用数据可扩展性拓宽业务领域

D. 提高社会效益,优化社会管理

7.当前,大数据产业发展的特点是

A. 规模较大

B. 增速很慢

C. 增速很快

D. 多产业交叉融合

8.下列关于数据生命周期管理的核心认识中,正确的是

A. 数据从产生到被删除销毁的过程中,具有多个不同的数据存在阶段

B. 数据生命周期管理最终关注的是社会效益

C. 根据数据价值的不同应该对数据采取不同的管理策略

D. 数据生命周期管理旨在产生效益的同时,降低生产成本

9.下列关于基于大数据的营销模式和传统营销模式的说法中,错误的是

A. 基于大数据的营销模式比传统营销模式精准性更强

B. 传统营销模式比基于大数据的营销模式针对性更强

C. 传统营销模式比基于大数据的营销模式转化率低

D. 基于大数据的营销模式比传统营销模式实时性更强

10.传统数据密集型行业积极探索和布局大数据应用的表现是

A. 投资入股互联网电商行业

B. 打通多源跨域数据

C. 提高分析挖掘能力

D.实现科学决策与运营

 

 

答案解析:

1.ABD

2.ABD

3.ABC

4.AB

5.ABCD

6.ABC

7.ACD

8.AC

9.BC

10.BCD

 

大数据培训资讯:大数据面试真题第六期Hadoop&大数据基础

(共30分,每题6分)

1.简单概述一下hadoop1与hadoop2的区别  

2.hadoop的shuffer的概念  

3.Hadoop 的核心配置文件是什么

4.简述HDFS的原理

5.简述大数据分析的整个流程

 

 

答案解析:

1.Hadoop2与hadoop1最大的区别在于HDFS的架构与mapreduce的很大的区别,而且速度上有很大的提升;hadoop2最主要的两个变化是:namenode可以集群的部署了,hadoop2中的mapreduce中的jobTracker中的资源调度器与生命周期管理拆分成两个独立的组件,并命名为YARN。

2.Shuffer是一个过程,实在map端到reduce在调reduce数据之前都叫shuffer,主要是分区与排序,也就是内部的缓存分分区以及分发(是reduce来拉数据的)和传输。

3.以前是hadoop-default.xml、hadoop-site.xml。现在是core-site.xml、hdfs-site.xml、mapred-site.xml;都在conf目录下。

4. 1)客户端向nameNode 发送要上传文件的请求。  

    2)nameNode 返回给用户是否能上传数据的状态。

    3)加入用户端需要上传一个 1024M 的文件,客户端会通过 Rpc 请求。 NameNode,并返回需要上传给那些 DataNode(分配机器的距离以及空间的大小等),namonode会选择就近原则分配机器。

    4)客户端请求建立 block 传输管道 chnnel 上传数据。 

    5)在上传时 datanode 会与其他的机器建立连接并把数据块传送到其他的机器上。

    6)dataNode 向 namenode 汇报自己的储存情况以及自己的信息。  

    7)当第一个快上传完后再去执行其他的复制的传送。

5. 1)hadoop是大数据分析的完整生态系统,从数据采集,存储,分析,转运,再到页面展示,构成了整个流程。

    2)采集可以用flume。

    3)存储用hbase,hdfs,mangodb就相当于hbase。  

    4)分析用Mapreduce自己写算法。 

    5)hive做数据仓库。  

    6)pig做数据流处理。 

    7)转储方面有sqoop,可以将hdfs中的数据转换存储到mysql,oracle等传统数据库。

 

不管是学习大数据还是想从事大数据行业,在掌握具体技术之前,也要对大数据有个整体的认知才行哦。更多大数据行业面试真题和大数据培训资料,关注成都科多大数据就能免费获取啦!

最新资讯更多+
内容推荐更多+
在线课堂
猜你喜欢