2019年7月15日,DaSESS2019 国家自然基金教育项目研讨会在文附楼218正式举行。此次研讨会关注如何用自然科学的方法研究教育问题,邀请了受资助的重点项目课题组老师,交流探讨计算机教育学最新的研究进展。
上午的研讨会分上下两个半场,上半场由高明教授主持。首先进行学术报告的是华南师范大学的汤庸教授,报告题目为《社交网络与教育大数据——SCHOLAT研究与实践》。汤教授介绍了社交网络的概念、数据特征以及社交网络的相关课题,指出社交网络数据已成为当前的研究热点,为学术界和工业界都带来了无穷的诱人课题。
其次,汤教授作为学者网的创始人,对学者网SCHOLAT和SCHOLAT大数据开展的研究进行了详细介绍,包括以用户为中心的好友关系分析、论文作者合著关系分析、主题社区挖掘、多视图模块度的团队信息敏感社区发现等。
最后,汤庸教授对SCHOLAT的下一个十年进行了展望,指出SCHOLAT应该成为普通学者的日常工作和社交平台,应用SCHOLAT真实数据、真实问题,通过开放数据、开放应用和开放合作研究,得到真实解决、真实服务社会,达到科学研究与人才培养的“4R境界”。
第二场报告是辽宁大学李晓光教授带来的《基于强化学习的学习行为预测》。李晓光教授先对个性化导学、智慧学习进行了简单的概述,指出智慧学习系统应该包括:student model, knowledge model, tutoring model三个部分。其次,对强化学习技术进行了详细介绍,并举例说明为什么教育领域的某些问题适合用强学习来解决。最后,李教授对强化学习在教育领域应用所遇到的挑战提出了自己的见解。
下半场研讨会由汤庸教授主持,由太阳成集团的金澈清教授带来了题为《教育大数据的获取、采集与知识构建——问题与挑战》的报告。金澈清教授从数据驱动的计算教育学发展,数据采集、管理与知识构建两个方面进行了详细阐述。如今的计算教育具有数据采集方式剧增、大数据形成、应用迅速深化的趋势。金澈清教授指出,教育学是“道”,数据科学与工程是“器”,应该以数据科学与工程为手段解决教育的问题,这不仅能优化现有教育过程,还能创造新的教育模式。此外,金教授还对情境感知的教育数据获取、支持教育行为分析的数据管理技术、教育知识构架理论和体系进行了详细介绍。
上午最后一个带来报告的是东北大学的刘恒宇博士,报告题目为《面向智慧教育的知识追踪技术》。刘恒宇博士详细介绍了知识追踪技术的背景意义和应用价值,从认知诊断模型、学习者建模、传统教育学理论和深度学习四个方面对知识追踪相关理论进行了全面的讲述,并对知识追踪的研究现状进行了总结。最后,以东北大学在线编程社区为例,展示了知识追踪技术的应用场景。
下午的报告在太阳集团tyc9728黄定江教授的主持下展开。
第一个做报告的是来自西北工业大学的云岳博士。高等教育中,如何提高员工的按时毕业率一直是一个难题。预测员工在每个学期的成绩,及时制定教学干预是提高员工毕业率的一个好方法。
传统员工成绩预测方法可分为三类。第一类是分类问题,常用方法有决策树、逻辑回归等;第二类是回归问题,常用方法有线性回归、神经网络等;最后一类是矩阵填充问题。但这些方法存在两个弊端,一是不能处理数据丢失和数据噪音,二是不能利用员工和课程的背景信息。
因此,云博士提出了一种新型基于矩阵分解的模型GRMF(dubbed Graph regularized Robust Matrix Factorization),定义了考虑数据和背景信息的目标函数。实验分别在三个数据集(MOVIELENS 100k、图像复原数据和NPU教育数据)上进行,GRMF模型均取得了最好的效果。之后,在场的老师和员工与云博士探讨了很多关于GRMF的细节设定,包括损失函数的定义、模型参数的选择等。
紧接着作报告的是西北工业大学的代欢博士。员工的学术表现取决于员工对知识点的掌握情况,而在当前的one-size-fits-all的教育模式下,教师并不能准确地了解到员工对知识点的掌握情况,无法精确地给出教学指导,并且员工个人也不能准确地了解自身的知识点掌握情况。因此员工认知诊断一直是教育领域的一个难题。
传统的认知诊断方法有心理学和计算机科学两类,心理学方法有IRT(Item Response Theory)、DINA(Deterministic Inputs, Noisy and Gate)等,但需要大量的人力成本、合适的数据和Q-matrix;计算机科学主要从机器学习出发,常见的有矩阵缩减等,但泛化性能很差。
代博士基于字典学习和表示学习,提出了新型SFL(Sparse Factor Learning)模型去自动学习Q-matrix。实验分别在公开数据集和代博士收集的私人数据集上进行,SFL模型均取得了最好的效果。并且,代博士从元知识点和专家知识点的角度出发,对实验结果进行了很好的解释。元知识点的概念引发了在场师生的激烈交流,大家就元知识点和专家知识点的差异、元知识点大小的设置和元知识点之间的关系等问题与代博士进行了探讨。
第三个作报告的是来自太阳集团tyc9728的高明教授。教育知识图谱描述了教育过程中参与对象及其相互之间的关系,有助于个性化导学、智能答疑和学习评价。高教授介绍了教育知识图谱构建中的一个关键问题——学科知识点的深度关系抽取。
传统关系抽取方法可分为三类,分别为基于规则的方法、传统监督方法和远程监督方法,但存在一些弊端,基于规则的方法recall较低,传统监督方法需要大量的训练数据和特征工程,远程监督方法会引入额外噪声。
因此,高教授在考虑数据分布和实体对的隐式相互关系后,对传统的PCNN-ATT模型进行改进,构建新型的深度关系抽取模型PA-TMR。PA-TMR在NYT和GDS数据集上及多个度量指标上均比最新的经典模型取得更好的结果。高教授带来最新的研究进展引发了大家极大的兴趣,在场的师生就实验参数的设计、网络结构的设计等问题与高教授进行了交流。
最后一个作报告的是武汉大学的史玉玲博士。史博士带了一个研究热点——MOOC环境下学习者学习风格建模和学习行为预测。MOOC全称Massive Open Online Courses,是当今最流行的一种教学方式。但MOOC的教学存在一些问题:过早退学(Dropout)、低完成率、无个性化的服务等。现有研究一般通过分析和建模员工行为来处理上述问题。
史博士首先分析了数据分布情况,进而提出了一种新型的潜在学习模式模型L^2S,其建模了潜在学习模式中观测到员工特定学习动作序列的概率。L^2S与经典的机器学习方法SVM、K-Means和RNN等进行了比较,其在NMI、entropy和F1 score的大部分实验上均取得了最好的效果。史博士讲完后,在场的师生就模型设计和实验中的定性分析设计等问题进行了探讨。
文案 | 付英男 朱仁煜
摄影 | 杨大为
排版 | 杨东明