基于时空聚类的居民出行及活动行为探究文献综述

 2023-08-16 03:08

文献综述(或调研报告):

1.使用只考虑起始点的流数据进行聚类的方法本质上是对起点和终点的聚类,传统的用于处理各种静态点数据的聚类算法可以分为5类:

(1)基于分区的方法

基于分区的聚类方法是在进行聚类前对最终分区数量进行设置,分区数量表示为参数kkle;n)。每个分区都是一个簇,至少包含一个数据点,并且每个数据点只能属于一个簇。典型的算法有k-means和k-medoids。K-means算法已被广泛地应用于各种领域,其核心思想是随机找到k个聚类中心,然后根据偏差迭代地将数据点分组到最近的聚类中心,直到所有聚类中心都收敛。

(2)基于层次的方法

基于层次的方法在层次的基础上分解给定的数据集,根据层次分解的方法,定义自底向上(结合)分解方法为凝聚层级聚类算法,定义自顶向下(分离)分解方法为分离层次聚类算法。凝聚层次聚类算法先将每个数据点作为一个簇,然后将这些原子簇组合起来,直到满足某种结束条件。分离层次聚类算法先将所有数据点放在一个簇中,然后逐步地将簇分割成越来越小的簇,直到达到最终的条件。

(3)基于密度的方法

基于密度的方法不同于以往各种基于距离的方法,当某区域的点密度大于阈值时,这种方法将该区域加入到距离较近的簇中。密度聚类算法克服了基于距离的算法只能对球形簇进行聚类的缺点,可以聚集任何形状的簇。

(4)基于网格的方法

基于网格的方法采用多分辨率网格数据结构,将数据空间量化为有限数量的单元(细胞),形成网络结构。所有的聚类操作都在网格上进行,网格中数据的压缩质量决定了聚类算法的质量。网格聚类算法的突出优点是处理速度快,处理时间与数据点的个数无关,只与量化的控件中各维的单元数有关。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。