本站所有资源均为高质量资源,各种姿势下载。
在本文中,我们介绍了一种聚类算法:k-medoids方法。在这种算法中,我们选取一个对象作为medoid来代替传统的中心的作用,这样一个medoid就可以标识一个类。下面是算法的详细步骤:
1. 首先,我们任意选取K个对象作为medoids(O1,O2,…Oi…Ok);
2. 然后,我们将剩余的对象分配到各个类中去,具体的方法是根据与medoid最相近的原则进行分配;
3. 接着,对于每个类(Oi)中的对象,我们顺序选取一个Or,计算用Or代替Oi后的消耗,即E(Or)。我们选择E最小的那个Or来代替Oi。这样K个medoids就改变了,接着就再转到步骤2进行循环;
4. 最后,我们循环直到K个medoids固定下来。
总体来说,这种算法对于脏数据和异常数据不敏感,但是计算量显然要比K均值要大,因此一般只适合小数据量。如果您需要实现该算法,可以使用我们提供的Matlab源代码。
在实践中,我们还可以通过调整某些参数来优化算法的表现,比如调整medoids的初始选择、修改E函数等等。希望这篇文章对您有所帮助!