你好,游客 登录
rss订阅 手机访问 
大数据分析
4个最受欢迎的大数据可视化工具
想像阅读书本一样阅读数据流?这只有在电影中才有可能发生。在现实世界中,企业必须使用数据可视化工具来读取原始数据的趋势和模式。
日期:03月29日 作者: 点击:243
「干货」2017年深度学习必读31篇论文(附论文下载地址)
一如既往,首先,标准免责声明适用,因为今年仅与GAN有关的论文就超过1660篇。我肯定会有疏漏,试图缩减到每两周一篇论文,包含了Imperial Deep Learning Reading Group上的大量素材。无论如何,我们开始吧。
日期:01月07日 作者: 点击:334
决策分类树算法之ID3,C4.5算法系列
一、引言
在最开始的时候,我本来准备学习的是C4.5算法,后来发现C4.5算法的核心还是ID3算法,所以又辗转回到学习ID3算法了,因为C4.5是他的一个改进。至于是什么改进,在后面的描述中我会提到。 二、ID3算法
ID3算法是一种分类决策树算法。他通过一系列的规则,将数据最后分类成决策树的形式。分类的根据是用到了熵这个概念。熵在物理这门学科中就已经出现过,表...
日期:10/29/2017 21:05:39 作者:Android路上的人 点击:560
8大经典数据挖掘算法
大概花了将近2个月的时间,自己把18大数据挖掘的经典算法进行了学习并且进行了代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面。也算是对数据挖掘领域的小小入门了吧。下面就做个小小的总结,后面都是我自己相应算法的博文链接,希望能够帮助大家学习。
日期:10/29/2017 21:03:31 作者:hechenghai 点击:285
大数据算法 十大经典算法
一、C4.5 C4.5,是机器学习算法中的一个分类决策树算法, 它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法 ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。 决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。 C4.5相比于ID3改进的地方有: 1、用信息增益率来选择属性。 ID3选择属性用的...
日期:10/29/2017 21:00:42 作者:水立方小冰 点击:482
值得膜拜的三个数据分析案例
今天给大家分享三个数据分析的经典案例,主要是学习其中的思路,当故事看吧,不要拘泥于文中故事的真实性。
日期:10/29/2017 20:58:49 作者: 点击:390
技术干货 | 购物篮数据的协通滤波去噪自编码
包括完整代码和数据集的 ipython 笔记本可以从阅读原文链接内获得。
日期:10/25/2017 20:43:30 作者:文| Aaqilb Saeed 译| 翟向洋 点击:175
中文分词工具-IKAnalyzer下载及使用
最近有个需求,需要对爬到的网页内容进行分词,以前没做过这个,随便找了找中文分词工具,貌似IKAnalyzer评价不错,因此就下来试试,在这里记录一下使用方法,备查。
日期:09/29/2017 18:00:26 作者:lxw1234@qq.com 点击:321
Spark MLlib实现的中文文本分类–Naive Bayes
关键字:spark mllib、文本分类、朴素贝叶斯、naive bayes
日期:09/29/2017 17:20:41 作者:lxw 点击:427
异构数据源海量数据交换工具-Taobao DataX 下载和使用
DataX介绍
DataX是一个在异构的数据库/文件系统之间高速交换数据的工具,实现了在任意的数据处理系统(RDBMS/Hdfs/Local filesystem)之间的数据交换。
目前成熟的数据导入导出工具比较多,但是一般都只能用于数据导入或者导出,并且只能支持一个或者几个特定类型的数据库。
这样带来的一个问题是,如果我们拥有很多不同类型的数据库/文件系统(Mysql/Oracle/R...
日期:09/29/2017 17:19:26 作者:lxw 点击:387
关于深度学习,这可能是你最容易读进去的科普贴了(七)
一、
神经网络计算,另一个常为人诟病的问题,是过度拟合(overfitting)。
一个拥有大量自由参数的模型,很容易通过调试,和训练数据吻合。但这并不意味着,这就是个好模型。
美国数学家冯纽曼(John Von Neumann)曾说, “给我四个参数,我的模型可以拟合一个大象。给我五个参数, 我可以让它扭动它的鼻子。”
神经网络模型的自由参数,现...
日期:09/28/2017 21:46:26 作者:王川 点击:238
关��深度学习,这可能是你最容易读进去的科普贴了(五)
一、
主流学术界的研究者,大多注重于在算法上的渐进式提高, 而轻视计算速度和用于训练的数据规模的重要性。
孔丘老师早在两千多年前,就高瞻远瞩的为深度学习指明了方向:“学而不思则罔, 思而不学则殆”。
用深度学习的语言来说,就是,“光有大数据,算得不快,则还是迷惘;光算得快,而没有大量的数据来训练,则还是疲倦无所得”...
日期:09/28/2017 21:45:31 作者:王川 点击:153
关于深度学习,这可能是你最容易读进去的科普贴了(三)
关于深度学习,这可能是你最容易读进去的科普贴了(三) 36氪的朋友们 • 2016-03-02 • 深氪 一个蛮力,一个来自 GPU 的计算蛮力,要在深度学习的应用中爆发了。
日期:09/28/2017 21:43:02 作者:王川 点击:148
关于深度学习,这可能是你最容易读进去的科普贴了(二)
科普贴的第二篇来了~
编者按:本文作者王川,投资人,中科大少年班校友,现居加州硅谷

1970年,当神经网络研究的第一个寒冬降临时。在英国的爱丁堡大学,一位二十三岁的年轻人,Geoffrey Hinton,刚刚获得心理学的学士学位。
Hinton 六十年代还是中学生时,就对脑科学着迷。当时一个同学给他介绍关于大脑记忆的理论是:
大脑对于事物和...
日期:09/28/2017 21:40:47 作者:王川 点击:225
关于深度学习,这可能是你最容易读进去的科普贴了(一)
神经网络研究的历史是怎样的?让我们一起在历史回顾中深入浅出的了解深度学习究竟是怎样的。
日期:09/28/2017 21:38:00 作者:王川 点击:259
  • 1/3
  • 1
  • 2
  • 3
  • »