文章摘要:针对包含类别数据与数值数据的高校教育大数据,采用基于汉明距离与欧式距离混合度量的K-prototype进行聚类,并通过轮廓系数对聚类效果进行评价,与常用的k-means、DBSCAN进行对比,实验结果表明:基于Kprototype的聚类在教育大数据的处理上更具优势。基于聚类结果,采用词云图构建了4类学生教育画像。画像从基本属性、生活消费、生活规律等维度将学生群体划分为“思想积极型学生”“夜猫子游戏型学生”“规律作息型学生”“节俭好学型学生”4类,为学生教育管理人员提供相应的决策支持。
文章关键词:
论文作者:翟鸣宇 程建 王苏桐 王延章
论文DOI:10.19525/j.issn1008-407x.2021.06.003
论文分类号:TP311.13;G647
文章来源:《大数据》 网址: http://www.dsjzz.cn/qikandaodu/2021/1018/2944.html