2019年9月23日9至12时,太阳成集团数据科学与工程研究生学术沙龙第2期在文附楼118教室如期举行。本次学术沙龙总共有四场报告。首先,加州大学河滨分校的Evangelos (Vagelis) Papalexakis助理教授作题为“Tensor Decompositions for Big Multi-aspect Data”的学术报告。之后,太阳集团tyc9728黄定江教授作题为“机器学习的可解释性:方法、应用和进展”的学术报告。接着,博士生申弋斌作了题为“基于深度学习的旅行时间预测问题研究”的学术报告。最后,硕士生杨康作题为“实体类抽取式机器阅读理解”的学术报告。本次学术沙龙由周昉博士和硕士生杨大为主持,共有70多人参与了活动,现场气氛热烈。
沙龙伊始,Evangelos (Vagelis) Papalexakis首先向大家汇报了其研究的基本框架和主要内容。他从张量原理开始讲起,向大家展示了利用张量分解作为数据分析工具的有效性,包括在社交网络分析、引力波、可解释人工智能上面的应用。在社交网络中,人们通过不同的应用程序进行沟通。这种不同应用上的社交关系,可以用多个矩阵来表示,每一个矩阵代表某种特定联系方式下人物之间的关系。但是,这种表示方式较为复杂,且如果对多个矩阵进行聚合,会忽略重要的结构信息。张量则可以解决这个问题,它很好地表达多平台上各用户之间的交互情况。随后,他举出了另一个例子,在网络虚假信息检测方面,利用张量分解获得新闻文章的表示,获取文章的上下文信息,构建成图,并进行标签传播,有效解决了标注数据少的问题。最后,又举出了引力波检测场景的例子,它利用了迁移学习的思想,将深度学习的分类模型迁移到频谱图的异常检测中。报告结束后,进入讨论环节,老师和同学们热情地与教授进行交流,如周昉博士在最后也代表同学们问教授关于科研工作的心得和体会,他说到坚持不懈最重要,没有人能简单轻松就完成高质量论文,并在顶会中发表。每个人都会面临失败,可贵之处就在于不断地继续尝试、探索。
黄定江教授围绕“深度学习成功的背后”,“可解释的机器学习”,“未来的挑战方向”三大主题展开自己的报告。首先,黄老师从深度学习的概念着手,对 “深度学习等同于深度神经网络”的传统观点提出质疑,并鼓励同学们要充分发挥想象力,推陈出新。随后,谈到机器学习的可解释性,黄老师先后系统阐述了可解释性的定义、分类以及它在现实生活中的具体应用。可解释性可分为Ante-hoc可解释性和post-hoc可解释性,它们下面还有自解释模型、全局解释模型、局部解释模型等。可解释性也广泛应用于辅助分析、知识发现和安全性分析等实际问题。最后,他从解释方法设计和解释方法评估两大领域,向同学们介绍可解释性在未来的挑战方向并做出了总结。在报告结束后,教授指出机器学习可解释性是一个非常有前景的研究领域,已成为了国内外的研究热点,希望同学们紧跟时代潮流,关注科技前沿,做到既“专”又“博”。
申弋斌同学的研究主题是如何给一条路径求出准确的旅行时间预测,这是打造“智慧城市”中不可或缺的一环。过去的相关研究虽然致力于给出准确的结果,但是却忽略了速度特征和路网结构特征这两个至关重要的特征提取,以至于性能表现不佳。由此申同学提出了一个新的神经网络模型TTPNet,它能够有效地同时提取速度特征和路网结构特征,并给出更为准确的预测结果。总的来说,TTPNet包含三个部分:速度特征层(依靠张量分解还原过去一个小时的速度分布,并利用CNN-RNN模型获取速度特征)、路网结构特征层(依靠图嵌入技术捕捉路网结构的局部和全局特征)和深度LSTM预测层(完成预测任务)。报告的最后,申同学将结果和其它项目进行了对比,突出了TTPNet模型更好的准确性,和有强大的鲁棒性。
杨康同学从神经网络应用于自然语言处理的几个例子开始他的报告,随后介绍报告的主题,也就是近年来的热门领域之一——机器阅读理解。 该技术要求神经网络模型能够阅读问题和文档,并从文档中抽取出答案。而训练的数据集,也就是中文实体类抽取式机器阅读数据,则取自WebQA。接着,杨康同学重点介绍了多头注意力机制与双向注意力机制相结合的MBAN(Multi-head Bi-direction Attention Network), 该模型的作用是从多个层面充分抽取问题与文档的双端语义交互信息。在构建损失时,该模型结合计算机视觉领域所提出的Focal loss,能显著提升模型的训练效率,提高模型性能。在报告的最后,杨康同学详细说明了当前机器阅读理解在落地时,如何权衡模型性能与模型规模的难点,以及机器阅读理解模型的鲁棒性问题。
在场的诸位硕博士生也发表了自己的看法,提出了自己的问题。讲者也针对性地做出解答。最后,杨大为同学对本次学术沙龙活动进行总结,感谢大家的积极参与,期待系列活动越办越好。整场学术沙龙持续了近三个小时,与会师生均表示大有收获。
文案 | 骆绪锐
摄影 | 刘婷婷
排版 | 方敏