你好,游客 登录
rss订阅 手机访问 
大数据入门
艾叔,我的两台虚拟机咋就通不了呢?
日期:07月21日 作者: 点击:370
Python or Java? 真的没有那么重要
日期:07月21日 作者: 点击:358
什么样的数据可以称为“大数据”?

本文节选自艾叔即将出版的图书《Spark大数据编程实用教程》
1. 大数据定义
维基百科对大数据的定义如下:
大数据是指传统数据处理应用软件无法充分处理的太大或太复杂的数据集。
本书采用上述定义作为大数据定义,因为它描述了大数据的本质,而大数据的其它特性,如下所示,都可以由此定义推导出来。
大数据的4V特性;
大数据处...
日期:07月21日 作者: 点击:801
明明是按书上的步骤一步步来的,为什么还总出错?

明明是照着书上的步骤一步步来的
为什么还总报错呢?
这是很多编程初学者经常遇到的问题。
这个问题,艾叔一开始时,也是经常遇到,很是头疼。
但后来,类似问题就越来越少了,很多时候,都是一次成功。
这里,艾叔送大家3个锦囊,有它们加持,可以少出错,少踩坑。
锦囊一:环境一致
我们自己构建实验环境时,一定要先老老实实...
日期:07月21日 作者: 点击:1157
大数据开发的通用步骤

本文节选自艾叔即将出版的图书《Spark大数据编程实用教程》
大数据的开发过程,如图1-1所示。
图 1-1大数据开发通用步骤图
上图只是一个简化后的步骤和流程,实际开发中,有的步骤可能不需要,有的还需要增加��骤,有的流程可能更复杂,因具体情况而定。
下面以Google搜索引擎为例,来说明以上步骤。
1. 大数据采集
Google的数据来...
日期:07月21日 作者: 点击:452
艾叔:最全【大数据采集技术】总结
本文节选自艾叔即将出版的图书《Spark大数据编程实用教程》
日期:07月21日 作者: 点击:491
艾叔:大数据存储技术
日期:07月21日 作者: 点击:449
大数据处理技术
​本文节选自艾叔即将出版的图书《Spark大数据编程实用教程》
日期:07月21日 作者: 点击:371
一根网线的套路
​话说艾叔刚参加工作时,还是百兆网络,有天领导发话要做网线,虽然学过计算机网络,自己做网线还是头一回,想想挺好玩的,便满口接应了下来。
日期:07月21日 作者: 点击:288
艾叔:和女儿讲大数据
女儿:老爸,前面你和我讲了什么是云计算,今天能不能和我讲下什么是大数据呢?
日期:07月21日 作者: 点击:274
精选|2019艾叔文章合集,你读过几篇?
​自2019年开始公众号“艾叔编程”以来,至今天正好半年。
日期:07月21日 作者: 点击:234
艾叔:高效程序设计的七个习惯
这是艾叔之前发表的一篇教学论文,也是对自身多年工程实践和教学经验的一个总结。
日期:03月31日 作者:艾叔 点击:700
艾叔:vmware虚拟硬盘越来越大,怎么办?
VMware使用过程中,虚拟硬盘vmdk文件的体积会越来越大。
日期:03月31日 作者:艾叔 点击:971
艾叔推荐:必备编程工具系列(002)-编程重器Linux
上一节介绍了VMware,它可以在一台计算机上虚拟出多台计算机,这个在我们平时开发、测试中用的非常多。
日期:03月31日 作者:艾叔 点击:594
  • 1/4
  • 1
  • 2
  • 3
  • 4
  • »