1项目背景
高考是国家选拔优秀人才的重要方式,对即将步入成年的高三学生来讲是一次极为重要的考验。而填报志愿是继高考考试之后又一重大选择难题,它是一个一次性且不可逆的选择,对考生来说至关重要。高考志愿填报涉及学校和专业的选择。青年人的学校和专业志愿选择意味着其对未来职业生涯发展的选择。这种选择又受到个人兴趣、成绩因素、家长建议、地域因素、名校因素等因素的影响。每年高考成绩公布与志愿填报之间的时间非常短,高中毕业生需要在短短的几天内对自己未来的职业生涯发展做出决策。他们往往面临着各种各样的决策困难。
特别是自2014年高考改革以来,高中生需要在高中选择除语数外的其他的三门课程计入高考总分,该三门课程直接影响大学专业选择。除此之外,志愿填报顺序由原来的“院校 专业(类)”转变为“专业(类) 院校”。以山东省为例,考生有96种志愿填报方式,这极大的增加了考生志愿填报的难度。
与此同时,高校招生也面临诸多信息不对称问题。近年来,虽然网络媒体的发展缓解了一部分信息传递不通畅的问题,但依然存在很多考生与家长无法相对客观掌握高校招生信息。甚至每年都不同程度地出现高分考生落榜的现象,如此种种都影响到考生职业生涯起始的质量,甚至会改变其一生的发展道路。由此可见,合理填报高考志愿是十分重要的。
2文献综述
2.1关于高考志愿填报策略
李晓燕等人根据多年的招生考试经验从技术角度提出填报高考志愿的策略,报考之前应进行职业规划、详细了解招生院校和招生专业的信息,阐述了院校录取模式和专业分配模式、录取批次和专业特征,并呼吁考生按照高考成绩预设报考范围,合理制定志愿填报方案[1]。赵洁等人以2020年山东夏季高考为例,根据平行志愿投档规则对往年位次和计划数据分析进行数学建模,提出考生根据位次进行精准化志愿填报的策略,为当年山东新高考改革的考生给出志愿填报的建议[2]。李涛将考生根据高考成绩划分为高分考生、次高分考生、中等成绩考生、一般成绩考生与较低分考生,并根据段位不同给出相应的报考建议[3]。
2.2关于用户群体画像
王震飞等人基于RFM模型和K-Means聚类算法构建图书馆学、情报学、档案学三个学科领域博主博主群体画像[4]。徐海玲等人利用Con Exp1.3工具构建不同群体用户类别的细分标签,通过概念格对高校图书馆不同借阅群体:本科生群体、研究生群体、教师群体的用户行为进行关联规则挖掘,精准刻画阅读群体兴趣画像[5]。黄建国等人基于xAPI的在线学习环境中精准师训画像构建的流程,包括数据保存、数据收集、数据分析、画像生成和个性化推荐五个步骤,从而提供了清晰的框架指引。最后进行了精准师训画像建模,提出了个体画像建模和群体画像建模以及通过建立标签进行精准师训画像建模的方法[6]。
2.3关于高考志愿推荐系统构建
任洛漪等人针对考生高考最终录取专业与高考排名不匹配的问题提出了新的志愿推荐算法,即先根据高考排名匹配命中专业,然后从命中专业中筛选心仪专业,最后挑选心仪专业最多的学校作为靠前志愿的学校,从而提高高考志愿的有效性和学生满意度。在数据库实现过程中,采用两张数据库表,即学校专业分数表、历年分数段表[7]。
徐楠楠等人对涉及新生报到的10个业务活动进行梳理和再造,形成从招生到新生报到的上下游业务闭环,然后依据信息标准,对各业务活动数据进行采集、清洗、转换、存储的全生命周期管理,消除信息孤岛。利用 Python 程序设计语言,从计划、录取、报到等多个维度对招生数据进行分析,纵向比较近几年招生计划数和录取数,引入Sklearn库中的Linear Regression 构建回归模型,并对招生数据进行预测,指导并完善学校的招生决策[8]。
王炳堃等人基于OLAP联机分析处理设计民办高校招生预测系统,依据实际招生系统的需求,详细设计了系统的整体结构及各个功能模块;应用数据仓库、OLAP等技术,在数据仓库的设计与实施过程中对多维建模和联机分析处理等技术进行了使用和实现[9]。
许焕新等人设计了一种辅助高考志愿填报系统,包括院校/专业咨询模块、数据分析模块、志愿填报模块、测评中心模块[10]。
