你好,游客 登录
kmeans 的搜索结果
大概花了将近2个月的时间,自己把18大数据挖掘的经典算法进行了学习并且进行了代码实现,涉及到了决策分类,聚类,链接挖掘,关联挖掘,模式挖掘等等方面。也算是对数据挖掘领域的小小入门了吧。下面就做个小小的总结,后面都是我自己相应算法的博文链接,希望能够帮助大家学习。
http://bigdatastudy.net/show.aspx?id=392&cid=13日期:2017-10-29 21:03:31
一、C4.5 C4.5,是机器学习算法中的一个分类决策树算法, 它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法 ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。 决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。 C4.5相比于ID3改进的地方有: 1、用信息增益率来选择属性。 ID3选择属性用的...
http://bigdatastudy.net/show.aspx?id=391&cid=13日期:2017-10-29 21:00:42
介绍
k-means算法原理比较简单,与上之前提到的C4.5算法不同,C4.5属性分类算法(有监督的),而k-means算法属于聚类算法(无监督的),两者有着本质的区别。
具体的算法描述如下:
1、随机选取 k个聚类质心点 2、重复下面过程直到收敛 { 对于每一个样例 i,计算其应该属于的类:
对于每一个类 j,重新计算该类的质心:
比较好理...
http://bigdatastudy.net/show.aspx?id=334&cid=9日期:2017-9-29 16:49:51
问题导读:
1.什么是LDA文档问题模型?
2.LDA 建模算法是什么样的?
3.spark MLlib中的LDA模型如何调优?
4.运行LDA有哪些小技巧?
上次我们简单介绍了聚类算法中的KMeans算法,并且介绍了一个简单的KMeans的例子,本次按照我的计划,我想分享的是聚类算法中的LDA文档主题模型,计划从下次开始分享回归算法。
什么是LDA主题建模?
隐含狄利克雷...
http://bigdatastudy.net/show.aspx?id=66&cid=9日期:2017-9-6 20:38:27
1.概述
首先,笔者要先申明,我也 是初学机器学习领域的内容,虽然我是从事大数据平台开发的工作,但是工作中确实没有跟spark MLlib打过交道,所以文中如果有描述错误的地方,还请大家指正。机器学习对高数、python的基础都有一定的要求,但是入门我觉得最重要的是理论联 系实际,了解机器学习基本概念,然后结合spark MLlib的example代码去入手,亲自跑一个代码尝试一...
http://bigdatastudy.net/show.aspx?id=65&cid=9日期:2017-9-6 20:34:47
  • 1/1
  • 1