大数据与智能工程学院举行学术沙龙系列活动(二)—离群检测无参化与复杂流形聚类算法研究

发布时间:2021-09-12浏览次数:2677

202149日,我院在崇信楼209会议室举行了2021年第二次学术沙龙活动,本次沙龙主题为“离群检测无参化与复杂流形聚类算法研究”,由黄金龙博士主讲,全体教职工参加。

  

  

黄金龙博士为了解决离群检测算法中的参数敏感问题,首次将自然邻居概念引入到离群检测中,通过自然邻居自适应地得到邻域参数K,然后通过K值找到每个数据点的自然影响域,基于LOF算法思想提出了新的局部离群因子概念——自然离群因子(NOF),从而使得NOF无需邻域参数K便能有效的检测出数据集中的全局离群点和局部离群点。为了解决离群检查算法需要参数Top-n的问题,提出了专门用于离群簇检测的粗糙聚类算法,然后通过计算粗糙聚类算法得到的每个簇的变量级和相对离群簇因子,找到数据集中的离群点和离群簇。为了解决复杂流形数据聚类难的问题,基于中心的思想提出了准聚类中心概念,准聚类中心为局部邻域中数据密度最大的数据对象,然后通过准聚类中心向密度稀疏的区域不断扩展的方式得到初始簇,利用初始簇存在交集的特性,提出新的簇相似度概念,然后不断地融合簇相似度较大的簇得到最终的聚类结果,从而解决复杂流形聚类难的问题。

  

  

黄金龙博士报告完成后,胡新、邢昌元、程东东等老师纷纷提出相关的问题,发表自己的看法,进行了讨论。学院通过组织系列的学术沙龙活动,希望能为推进学院科学科建设,营造学院良好学术氛围,为学院教师学术交流搭建平台起到积极的推进作用。