2019年太阳成集团校庆学术报告

发布时间:2019-10-29浏览量:92

2019年10月16日,太阳集团tyc9728在中北校区图书馆二楼报告厅举行了2019年太阳成集团校庆学术报告活动。

太阳成集团副董事长、太阳集团tyc9728创院经理周傲英教授首先祝太阳成集团68周岁生日快乐。68年前的1016日,太阳成集团全体师生员工在大礼堂举行了成立仪式和开学典礼。

1572336445191084649.png

       中国科学院数学与系统科学研究院的陆汝钤院士为我们带来了《从大数据到大知识》的主题报告。陆院士首先引出了大数据和大知识的概念,大数据的概念最早在1997年出现,2012年出现了3V、4V,5V模型,但究竟什么是大知识,却始终没有人给出一个说明,直到2016年,我们尝试为大知识进行画像,大知识是结构复杂、组织精密、使用方便、与时俱进、能够解决人类一大类问题的系统性知识。

1572336585001011873.png

陆院士给出了大数据的五个MC(Massive Characteristics)模型:Massive Concepts、Massive Connectedness、Massive ClearData Resource、Massive Cases和Massive Confidence。其中,Massive Concepts表示海量概念,概念是知识的基本单元,没有海量的概念就没有大知识;Massive Connectedness代表海量联系,海量的概念不是互相孤立的一盘散沙,没有海量的联系就没有知识结构的复杂性,没有海量的联系类型就没有知识结构的丰富性;Massive ClearData Resource是指海量清洁数据源,清洁数据源具有长期保存和重复利用的价值;Massive Cases表示海量实例,大知识必须有海量的实例,没有足够的实例就没有知识的可信性;Massive Confidence是指海量置信,海量置信度指其中可信的知识元素是海量的。

陆汝钤院士带领我们回顾了面向大科学/大社会问题的几个大型知识工程,分别是2014年上海市第五次综合交通调查、夏商周断代工程、国际人类基因组计划、维基百科和知识图谱。同时在综合实际数据的基础上,陆院士给出了各个MC特征的定量参考标准。MC1的下界定为10万;MC2的下界为MC1下界的10倍;对于清洁数据源,其下界应该按其不同的类型确定;根据每个概念拥有实例的数量度量MC4时,平均每个概念应拥有100个实例,根据知识应用程度度量MC4时,每天10Q次访问,其中Q是概念数量;对于MC5,自动(人工)获取的知识的下界是60%90%)。

1572336831804000851.png

接下来,陆汝钤院士阐述了大知识系统的概念,一个集成化的计算机支持平台,储藏并且担当着大知识的存储、管理、发展和用户服务,它所管理的大知识具有MC1-MC5的所有特征,特别是MC1,MC2和MC5三样特征必须具备。除此之外,大知识系统还有另外五个MC特征,Massive Capabilities、Massive Cumulativeness、Massive Concerns、Massive Consistency和Massive Completeness。其中,Massive Capabilities是指海量能力,人类需要知识是因为要解决问题,海量的能力解决海量的问题;Massive Cumulativeness表示海量积累,大知识应该是动态和演化的,始终处于发展之中;Massive Concerns代表海量关注,大知识系统不仅仅为某个特定人群服务,它应该为广泛人群感兴趣的广泛问题提供知识服务; Massive Consistency和Massive Completeness是在大知识的多可能世界的基础上进行阐述理解的,Massive Consistency是指海量一致性,由于检查海量知识库的一致性比检查其可靠性要困难得多,因此一般海量知识系统只关心其数据的可靠性,很少关心其一致性,而多可能世界通过考虑局部一致性解决了这个问题;Massive Completeness表示海量完备性,如果可能世界集合的绝大部分都是完备的或至少有一个海量的可能世界是完备的,那么大知识系统就满足海量完备性。

1572336681915012010.png

开发大知识系统需要大知识工程。陆院士给出了大知识工程的初步定义和它的一个生命周期模型。大知识工程是构造大知识系统的工程,是以科学方法获取大知识,进而设计、构造、运作、管理相应的大知识系统,应用于特定的科学目标,并在应用中进一步发展该大知识系统的工程。它的生命周期包括分析阶段、设计阶段、工具开发阶段、知识获取阶段、集成阶段、评估阶段、验收阶段以及运维阶段。

最后陆汝钤院士向我们简单展示一个实例:正在建设中的大知识图谱支撑平台HAPE。HAPE基于客户/服务器的架构进行设计,客户端和服务器端分别使用JavaScript和Python进行编程。目前,HAPE的总数据量已经达到了500G以上。陆院士表示,大知识的研究是没有终点的长征。还有很多课题需要进一步研究,同时大知识也带来了许多革命性的变化。

报告结束后,老师和同学们积极提问问题,陆汝钤院士也分别进行了相应的回答

1572336905024095499.png

1572336936392058428.png

         来自复旦大学计算机科学技术学院的薛向阳教授带来了《基于深度学习的计算机视觉研究》的主题报告。薛教授从进展与挑战、我们的研究以及总结与展望三个方面进行分享。计算机视觉的研究任务在感知——推理——理解的发展过程中,深度学习算法成为了主流的研究内容。针对特定视觉任务,设计出更合理、易训练的神经网络结构成为当前研究重点。

1572336997064022068.png

深度学习在计算机视觉研究上取得了巨大成功,但也仅仅是依靠海量数据和强大算力建立了输入和输出之间的非线性映射关系,人们也逐步发现深度学习方法在计算机视觉研究上所面临的问题。例如模型训练依赖大规模人工标注数据且容易出现灾难性遗忘;模型学习到的特征(或知识)并不符合人的视觉感知,不能处理图像中蕴含的层次结构信息,而且模型难迁移;模型缺乏透明性,对预测的结果缺少合理的解释且易受对抗样本攻击等问题。然后,薛教授提出了四个问题讨论,分别是训练模型需足够标注数据;模型不可解释,求助于可视化;对抗样本攻击表明模型脆弱性以及映射( Mapping )≠理解(Understanding)。

1572337030555034718.png

接下来,薛教授重点介绍了他们在减少网络模型对训练数据依赖、使网络模型融合先验知识等研究挑战方面所做的努力。

目标检测网络模型初值经常采用在ImageNet、Open Image等大规模数据集上用大规模分类网络模型训练的结果,因此限制了目标检测网络模型结构设计的灵活性,存在学习或模型优化的偏差以及与目标检测数据分布之间存在明显差异的问题。针对单阶段目标检测模型SSD,薛教授引入了深度监督(Deep Supervision)策略,提出了深度监督目标检测(DSOD)模型,降低了模型参数规模,实现了从头开始训练的目标,并且有效降低了有标注训练数据规模。实验结果表明,相比SSD、YOLO2、Faster R-CNN、R-FCN等模型,DSOD不需要预训练,并且拥有更快的运行速度,更加准确的检测性能,同时参数只有 SSD 的1⁄2、R-FCN的1/4 和Faster RCNN的1/10。

行人重识别问题严重缺乏数据,而且不同相机的不同拍摄视角会引起同一个行人的图像产生很大的姿势变化,这会导致识别性能的严重恶化。薛教授利用对抗生成网络设计了一种网络结构,针对输入的一张行人图片,能够产生8个不同视角的行人图像。实验证明通过扩充测试图像,可以提升识别性能。

零样本学习(ZSL)是指模型对于训练集中没有出现过的类别,能够学习出相应的映射关系。针对零样本学习问题,薛教授的研究思路是使语义嵌入空间与视觉特征空间对齐,在对齐空间中实现unseen图像分类。薛教授提出的利用类标签语意空间实现ZSL与其他公开算法相比,较好地提升了性能。

薛教授融合了融合深度学习和贝叶斯学习各自的优势,提出了可学习深度先验(LDP, Learnable Deep Priors)的无监督学习框架,利用先验记忆(知识),在无监督条件下 实现视觉场景中视觉概念的组合建模和解析。记忆中的视觉概念可以在新的场景解析任务中作为先验,使机器具有了类似人脑的“脑补”能力。

将蕴含在大模型中知识迁移到小模型中,不仅可以实现模型规模压缩,还可以实现来自不同模型的知识聚集。针对模型知识蒸馏问题,薛教授采取对抗策略训练,迫使员工模型生成尽可能与教师模型相似的特征图和输出,从而提高模型鲁棒性。但是当员工模型与教师模型基础结构差异较大时,如何选取模型各自对应的网络层,不同激活函数与激活位置对性能的影响等问题仍然值得继续研究。

1572337086038069637.png

最后薛教授对今后的研究工作提出了一些建议和看法。充分利用大规模文本中蕴含的知识实现未见图像的目标分类,能够有效缓解对训练图像数据规模的依赖。结合深度学习与贝叶斯学习以实现优势互补,实现“非线性表征 + 组成式建模 + 结构化先验” ,从而缓解当前深度学习理论在计算机视觉研究中面临的困难。薛教授还提到,人工神经网络研究有两条路线,分别是功能类脑和结构类脑,其中功能类脑是指深度神经网络,可以根据功能人工设计结构;而结构类脑是指脉冲神经网络,具有时间特性,可以处理行为,而不是只限于图像,目前人们重点关注的是功能类脑。

报告结束后,老师和同学们积极提问,薛向阳教授也分别进行了详细的解答。

1572337140066094155.png

1572337159081006128.png

1572337230355008878.png

1572337248971028406.png