某部电影的宣传部门为了确定电影首映的影院,现对所在地区的影院的电影票舊卖情兄和影院容纳量等信息进行调查,调查结果存储于“电影票数据.csv“中。电影票数据(主要包含不同电影在不同影院的销售情况与放映历史,其特征说明如表7.9所示
通过构建 K-Means 模型对数据进行聚类,并对模型进行评价,以确定满足要求的首映影院,以及划分的各个影院类别情况,具体操作步骤如下。
(1)读取“电影票数据.csv”数据集。
(2)筛选出与影院有关的特征,并处理缺失值,将处理后的数据赋值给新建的cinema数据框。
(3)使用K-Means 模型对“cinema”数据进行聚类。
(4)使用轮廓系数评价法对模型进行评价,并绘制轮廓系数走势图
评论 (0)