你好,游客 登录
rss订阅 手机访问 
大数据面试题
最近经历的一些大数据(Spark/Hadoop)面试题
公司A:
1.讲讲你做的过的项目。 项目里有哪些 难点重点注意点呢?
2.讲讲多线程吧, 要是你,你怎么实现一个线程池呢?
3.讲一下Mapreduce或者hdfs的原理和机制。map读取数据分片。
4.shuffle 是什么? 怎么调优?
5.项目用什么语言写? Scala? Scala的特点? 和Java的区别?
6.理论基础怎么样,比如数据结构,里面的快速排序...
日期:01月06日 作者:唐予之_ 点击:616
spark面试问题汇总(持续更新....)
spark-submit的时候如何引入外部jar包
spark shuffle的具体过程,你知道几种shuffle方式
spark 如何防止内存溢出
cache和pesist的区别
怎么处理数据倾斜
​简要描述Spark分布式集群搭建的步骤
spark使用:
1)当前文件a.text的格式为,请统计每个单词出现的个数、计算第四列每个元素出现的个数
A,b,c,d
B,b,f,e
...
日期:09/18/2017 12:57:47 作者:mayuoo 点击:756
一道腾讯前端试题,位图法(bitmap),感受一下什么叫做“算法”
学了这么久编程了,for循环使用了不知道多少次。解决一个计算问题,可以用n种不同的方法来实现,而优秀的算法,可以提高计算效率,这对于大量的计算有着显著的作用。
日期:09/13/2017 16:29:47 作者:丛子 点击:457
Python面试题汇总
拿网络上关于Python的面试题汇总了,给出了自认为合理的答案,有些题目不错,可以从中学到点什么,答案如不妥,请指正......
日期:09/13/2017 13:42:51 作者:杰瑞26 点击:1253
PYTHON 一些基础面试题目总结
1.    Python是如何进行内存管理的?
答:从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制
一、对象的引用计数机制
python内部使用引用计数,来保持追踪内存中的对象,所有对象都有引用计数。
引用计数增加的情况:
1,一个对象分配一个新名称
2,将其放入一个容器中(如列表、元组或字典)
引用计数减少...
日期:09/13/2017 13:40:03 作者:自在逍遥 点击:686
很全的 Python 面试题
很全的 Python 面试题 Python语言特性 1 Python的函数参数传递
日期:09/13/2017 13:37:42 作者:taizilongxu 点击:954
R语言 面试题
尊敬的读者,这些R语言面试题是专门设计的,以便您应对在R语言相关面试中可能会被问到的问题。 根据我的经验,良好的面试官几乎不打算在你的面试中问任何特定的问题,通常都是以如下的问题为开端进一步展开后继的问题。
日期:09/13/2017 13:36:56 作者:xiaoxiaogang 点击:1552
spark 测试题
1. spark 的四大组件下面哪个不是 ( )
A.Spark Streaming B Mlib C Graphx D Spark R
2.下面哪个端口不是 spark 自带服务的端口 ( )
A.8080 B.4040 C.8090 D.18080
3.spark 1.4 版本的最大变化 ( )
A spark sql Release 版本 B 引入 Spark R C DataFrame D支持动态资源分配
4. Spark Job 默认的调度模式 ( )
A FIFO  B FAIR  C 无  D...
日期:09/13/2017 13:34:13 作者:洪荒或有仙 点击:965
Spark 和hadoop的一些面试题(准备)
1、将现有逻辑在spark上面实现。
2、数据倾斜怎么处理?
  数据倾斜有很多解决方案,本例子简要介绍一种实现方式,假设表A 和表B连接,表A 数据倾斜,只有一个key倾斜,首先对A进行采样,统计出最倾斜的key,将A   表分隔为A1 只有倾斜 key, A2 不包含倾斜key, 然后分别与 表B 连接。
  最后将结果合并, union
3 、各完成一个awk和sed的例子,...
日期:09/13/2017 13:33:02 作者: 点击:757
Spark面试经典系列之数据倾斜
Spark面试经典系列之数据倾斜 Spark面试经典系列之数据倾斜:数据倾斜之痛
日期:09/13/2017 13:32:02 作者: 点击:484
Hadoop/Spark相关面试问题总结
面试回来之后把其中比较重要的问题记了下来写了个总结:
日期:09/13/2017 13:29:35 作者:小黑 点击:913
老学员面试hadoop面试题总结
1、项目处理的大致数据流���(根据自己的项目回答)
2、hive的优化有哪些?
3、关系型数据库导入到HBase/HDFS的方式有哪些? 我回答了sqoop、api、bulkload,面试官说还有一种工具,让我回去查,我至今没查到。
4、MR优化(我能把整个MR的执行流程画出来,然后每个阶段的配置编程优化讲一些,
结果他说不是说这么细的,然后我回答主要是磁盘IO和网络传输,他...
日期:09/13/2017 13:27:25 作者: 点击:397
Spark应届生面试经验
2016-4-20 下午,杭州某公司面试
面试内容概要:
由于没有c#的试题,所以直接跳过考试部分,直接开始负责人面试。
第一类问题:关于数据的爱好性问题
1.​你是从什么时候开始接触数据挖掘之类的技术?
回答:2年前​
2.简要介绍一下你学习数据挖掘技术的大致历程
回答:2年前接触数据挖掘,从R语言的相关学习,到后面的参加Spark相关培...
日期:09/13/2017 13:26:46 作者: 点击:403
Hadoop就业面试题
以下资料来源于互联网,很多都是面试者们去面试的时候遇到的问题,我对其中有的问 题做了稍许的修改了回答了部分空白的问题,其中里面有些考题出的的确不是很好,但是也不乏有很好的题目,这些都是基于真实的面试来的,希望对即将去面试或 向继续学习hadoop,大数据分析等的朋友有帮助!
日期:09/13/2017 12:44:13 作者: 点击:1224
总结记录一下我的第一次社招面试经历
已经凌晨2点多了,看来今天是失眠了,反正睡不着,写篇日记总结一下我的第一次社招面试经历吧。2015年12月1日办理了离职手续,离开了万通中心, 也算是和我的第一个东家正式说了再见,其实还是很喜欢国贸的,这是个美妙的地方,容纳着很多金融界人才们的梦想,每每晚上走到这里你会感叹帝都的夜景好 美,只可惜这里的多数人都顾不上欣赏这里的风景,每个人都生活在压力下,...
日期:09/13/2017 12:42:21 作者:IT_economy 点击:444
  • 1/2
  • 1
  • 2
  • »