你好,游客 登录
rss订阅 手机访问 
大数据入门
HBase 和 Cassandra的浅谈
一:简介
关于hbase和cassandra的探讨,主要从多个方面来说,从最基本的一步步往深入的说,从最基本的部署运维,到支持特性,使用功能以及各自的优势;
先从比较宏观的角度分析,HBase是基于Google的bigtable的论文实现的列式数据库,cap理论中更倾向于强调c(副本数据一致性)和p(分区容错性)。而Cassandra是号称dynamo 加上 bigtable(数据模型)的实现,cap...
日期:01月15日 作者:玄陵 点击:388
新数仓系列:开源组件运营(3)
大数据前几年各种概念争论很多,NoSQL/NewSQL,CAP/BASE概念一堆堆的,现在这股热潮被AI接过去了。大数据真正落地到车联网,分控,各种数据分析等等具体场景。
日期:01月15日 作者: 点击:382
新数仓系列:Hbase国内开发者生存现状(2)
大数据前几年各种概念争论很多,NoSQL/NewSQL,CAP/BASE概念一堆堆的,现在这股热潮被AI接过去了。大数据真正落地到车联网,分控,各种数据分析等等具体场景。
日期:01月15日 作者:朱洁 点击:318
新数仓系列:Hbase周边生态梳理(1)
大数据前几年各种概念争论很多,NoSQL/NewSQL,CAP/BASE概念一堆堆的,现在这股热潮被AI接过去了。大数据真正落地到车联网,分控,各种数据分析等等具体场景。
日期:01月15日 作者: 点击:393
NoSQL 还是 SQL ?这一篇讲清楚
1NoSQL的诞生原因
随着互联网快速发展,各种类型的应用层出不穷,所以导致在这个云计算的时代,对技术提出了更多的需求,主要体现在下面这四个方面:
低延迟的读写速度:应用快速地反应能极大地提升用户的满意度;
原因:当数据量达到一定规模时,由于关系型数据库的系统逻辑非常复杂,使得其非常容易发生死锁等的并发问题,所以导致其读写速度下滑非常严重...
日期:01月15日 作者: 点击:421
大数据实战案例:一文读懂推荐系统知识体系-上(概念、结构、算法)
本文主要阐述:
推荐系统的3个W
推荐系统的结构
推荐引擎算法
浏览后四章的内容请见下篇。
1. 推荐系统的3个W
1.1 是什么(What is it?)
推荐系统就是根据用户的历史行为、社交关系、兴趣点、所处上下文环境等信息去判断用户当前需要或感兴趣的物品/服务的一类应用。
1.2 为什么(Why is that?)
为什么我们要用到推荐系统呢?...
日期:11/16/2017 21:35:18 作者: 点击:613
一文带你理解深度学习的局限性

想让AI拥有人类的智慧,仍然有很长的路要走。

深度学习:几何视图
深度学习最令人惊讶的特点便是极易上手。十年以前,没有人可以猜得到经过梯度下降 法训练过的简单参数模型可以在机器感知问题上实现如此惊人的结果。现在,事实证明,研究者所需要做的只是使用足够大的梯度下降素材来训练参数模型。正如 Feynman 曾经描述宇宙一样,&ld...
日期:11/14/2017 18:21:55 作者:作者 | Francois Chollet 译者 | 聂震坤 点击:356
一文读懂深度学习与机器学习的差异
如果你经常想让自己弄清楚机器学习和深度学习的区别,阅读该文章,我将用通俗易懂的语言为你介绍他们之间的差别。机器学习和深度学习变得越来越火。 突然之间,不管是了解的还是不了解的,所有人都在谈论机器学习和深度学习。无论你是否主动关注过数据科学,你应该已经听说过这两个名词了。
日期:11/08/2017 21:22:29 作者: 点击:363
大数据和机器学习揭示十二星座的真实面目
“为什么我的论文总发表不了,是不是我天生就不是做研究的料?”很多同学在写论文中遇到挫折,经常会发出这样的疑问。那么今天我就用星座,真实的数 据和“高大上”的机器学习来帮大家分析一下原因。首先声明,我不是宿命论的支持者,也不懂占星术。本文也不是教大家如何成功,但利用本文的研究成果,可以 帮助大家少走些弯路。现在网络上充斥着各种星...
日期:11/08/2017 21:16:23 作者: 点击:702
放弃Python转向Go语言:我们找到了以下9大理由
转用一门新语言通常是一项大决策,尤其是当你的团队成员中只有一个使用过它时。今年 Stream 团队的主要编程语言从 Python 转向了 Go。本文解释了其背后的九大原因以及如何做好这一转换。
日期:11/06/2017 21:45:20 作者:Thierry Schellenbach,参与:黄小天、李亚洲 点击:529
云技术入门指导:什么是云计算技术,云技术用什么语言开发
云计算���术:
这里只是列出我所知道的,希望大家对云计算技术有所了解:
一首先让大家明白什么是云端,所谓云端需要两层理解
(1)服务不在本地,这一层可以理解为服务器
(2)它和普通的服务器是不一样的,这些云端的服务器的资源是共享的,一旦一个服务器不能承受,将会把任务分配给其他机器。
二、云技术与其他技术的区别:
云技术可以使用...
日期:10/26/2017 12:39:38 作者:xng2012 点击:328
什么是云计算
简介
大家知道什么叫做云计算吗?事实上,目前并没有一个确定的定义。然而概括来讲,所谓的云计算,指的就是把你的软件和服务统一部署在数据中心,统一管理,从而实现高伸缩性。
云计算拥有以下特点:
·      虚拟化和自动化
·      服务器,存储介质,网络等资源都可以随时替换
·      所有的资源都由云端统一管理...
日期:10/26/2017 12:38:14 作者:xukunddp 点击:165
数说行业 | 大数据入门你必须知道的关键词
算法与分析法
算法 (Algorithms) -可以完成某种数据分析的数学公式。算法被用于软件处理与分析输入的数据。
分析法(Analytics) –用于发现数据的内在涵义。通过分析,无用杂乱的数据可以转化成有益的结论。这里的重点是数据的影响力,而不是复杂的软件系统。这可能就是为何大家使用数据来完成自己的论述。数据分析有三种不同的类型:
描述性分析(Desc...
日期:10/26/2017 12:28:41 作者: 点击:307
现在学习大数据晚吗?
作为一门对数学和计算机都有较高要求的一门交叉学科,从事大数据是有一定门槛的,但相对于10年以上的职业生涯(国外顶尖数据科学家50-60岁仍然十分活跃),预备半年的时间来学习这个最炙手可热的技能还是很划算的。
日期:10/26/2017 12:27:50 作者:ppvke.com 点击:343
写给大数据开发初学者的话
导读:
第一章:初识Hadoop
第二章:更高效的WordCount
第三章:把别处的数据搞到Hadoop上
第四章:把Hadoop上的数据搞到别处去
第五章:快一点吧,我的SQL
第六章:一夫多妻制
第七章:越来越多的分析任务
第八章:我的数据要实时
第九章:我的数据要对外
第十章:牛逼高大上的机器学习
经常有初学��在博客和QQ问...
日期:10/26/2017 12:18:02 作者:lxw 点击:1017
  • 1/3
  • 1
  • 2
  • 3
  • »