首页 1 2 3 4 5 6 7

K-Means ++ 算法

Kmeans算法的缺陷：

• 聚类中心的个数K 需要事先给定，但在实际中这个 K 值的选定是非常难以估计的，很多时候，事先并不知道给定的数据集应该分成多少个类别才最合适
• Kmeans需要人为地确定初始聚类中心，不同的初始聚类中心可能导致完全不同的聚类结果。（可以使用Kmeans++算法来解决）

K-Means ++ 算法：

k-means++算法选择初始seeds的基本思想就是：初始的聚类中心之间的相互距离要尽可能的远。

1. 从输入的数据点集合中随机选择一个点作为第一个聚类中心
2. 对于数据集中的每一个点x，计算它与最近聚类中心(指已选择的聚类中心)的距离D(x)
3. 选择一个新的数据点作为新的聚类中心，选择的原则是：D(x)较大的点，被选取作为聚类中心的概率较大
4. 重复2和3直到k个聚类中心被选出来
5. 利用这k个初始的聚类中心来运行标准的k-means算法

从上面的算法描述上可以看到，算法的关键是第3步，如何将D(x)反映到点被选择的概率上，一种算法如下：

1. 先从我们的数据库随机挑个随机点当“种子点”
2. 对于每个点，我们都计算其和最近的一个“种子点”的距离D(x)并保存在一个数组里，然后把这些距离加起来得到Sum(D(x))。
3. 然后，再取一个随机值，用权重的方式来取计算下一个“种子点”。这个算法的实现是，先取一个能落在Sum(D(x))中的随机值Random，然后用Random -= D(x)，直到其<=0，此时的点就是下一个“种子点”。
4. 重复2和3直到k个聚类中心被选出来
5. 利用这k个初始的聚类中心来运行标准的k-means算法

可以看到算法的第三步选取新中心的方法，这样就能保证距离D(x)较大的点，会被选出来作为聚类中心了。至于为什么原因比较简单，如下图所示：

假设A、B、C、D的D(x)如上图所示，当算法取值Sum(D(x))*random时，该值会以较大的概率落入D(x)较大的区间内，所以对应的点会以较大的概率被选中作为新的聚类中心。

前端学习笔记：JavaScript基础语法（ECMAScript）

此博客参考b站：【黑马程序员前端JavaScript入门到精通全套视频教程，javascript核心进阶ES6语法、API、js高级等基础知识和实战教程】https://www.bilibili.com/video/BV1Y84y1L7Nn?p=76&vd_source=06e554

jenkins 使用python脚本日志输出问题

最近在整理打包流程，继续优化下打包速度，项目一直使用jenkins调用python脚本执行一些事情，但是每次优化速度我都是打日志，输出时间来查找哪里耗时多，但是jenkins一直不能及时输出日志，需要等，所以查了下原因。方法 1 只需要在 python执行添加参数即可例如

快速学会创建uni-app项目并了解pages.json文件

(创作不易，感谢有你，你的支持，就是我前行的最大动力，如果看完对你有帮助，请留下您的足迹）

Coursera-MachineLearning-Week9题目整理

编号按照对应的内容，1-1代表第一大部分遇到的第一题，R代表Review，C代表运行的代码（Code）。 1-1

java运行时莫名其妙报错,运行app.java时报错，显示无法自动连线，找不到userdomapper类型的bean，求解...

2019-09-20 13:03:10.678 INFO 11592 --- [ main] ConditionEvaluationReportLoggingListener : Error starting ApplicationContex

此版本的应用程序不支持其项目类型 (.etp)_敏捷项目工具JIRA Software已更新至v8.4，新增Oracle 18c和19c数据库等功能...

JIRA Software是优秀的敏捷项目工具，协助您追踪问题，集成代码，规划，开发，发布高质量的软件产品。点击下载JIRA Software v8.4最新试用版。问题归档进入下一级别（数据中心）在最新版中，已经扩展了问题

Pytorch Tutorial【Chapter 2. Autograd】

Pytorch Tutorial 文章目录

Mahout系列之推荐算法-基于用户协同过滤

Mahout的一大特色就是包含了推荐算法，里面包括了多种常见的算法，下面我们来分析分析。针对基于用户行为数据的推荐算法一般称为协同过滤算法。协同过滤算法有基于领域(neighborhood-based)的方法，隐语义模型(latent factor model)的方法，基于图

spring boot学习笔记（从0开始）之项目搭建、MongoDB集成、druid集成

1.搭建spring boot项目这个过程很简单，只需要去spring官网选择相应版本直接下载即可。

web之中间件漏洞

中间件简介中间件是介于应用系统和系统软件之间的一类软件，它使用系统软件所提供的基础服务（功能），衔接网络上应用系统的各个部分或不同的应用，能够达到资源共享、功能共享的目的。目前，它