AI in Fintech|基于层级多标签文本分类的金融事件检测

发布时间:2020-05-06浏览量:229

1588748988241057656.png


公司与瞰点科技(太阳成集团-瞰点科技金融大数据联合实验室)合作开展的“基于层级多标签文本分类的金融事件检测”的实践与研究成果:《F-HMTC: Detecting Financial Events for Investment Decisions Based on Neural Hierarchical Multi-Label Text Classification》被IJCAI 2020 AI in Fintech Track接收。IJCAI(International Joint Conference on Artificial Intelligence,国际人工智能联合会议)是人工智能领域的CCF-A类学术会议,至今已举办28届。本次IJCAI会议的论文接收率仅为12.6%,AI in Fintech Track的论文接收率为19.3%,这也是历届IJCAI会议中最低的接收率。


1588749164810052325.png


事件检测是从非结构文本中识别出事件及其类型的过程,是事件抽取的关键步骤,对基于事件检测的投研分析和交易市场预测等后续工作具有重要意义。在金融领域,股票和期货交易的投资者需要尽早地识别投资风险和机会,而事件检测可以帮助人们适时地关注所发生的各种事件,并对事件的后续影响进行分析,以规避有害风险进而获得更高的边际收益。投资者往往可以通过对检测事件来回测该事件与股票价格走势的联系与影响,以此帮助投资者制定更为合适的投资策略。


1588749290672098588.png


事实上,基于事件驱动的投资策略已经得到国际投资交易者的广泛认可,但如何更为准确精细的检测事件,是确保投资策略可靠有效的关键所在。在实际的应用场景中,往往以层级结构来表示和组织金融事件体系。面对具体的非结构性文本,比如金融新闻或证券公司发布的研报,每条文本可能蕴含一个角度或多个角度,因此可以为该事件分配一个或多个事件标签,来表明去对应的层次结构和类别。


图片 3.png


因此,我们将金融事件检测问题建模为层级多标签文本分类问题,其中事件体系可以表示为标签树,每个待检测事件可以被分配一个或多个标签,并表示为一条从根节点到目标节点的事件路径。我们在F-HMTC中提出的方案是:基于双向Transformer来构建编码网络,作为文本特征的提取器;将获得的文本表征作为分类器的输入,对文本做出层级分类预测。我们采用一层简单的前馈神经神经网络作为分类器,但是在损失函数的设计上我们没有采用传统的表现出色的层级交叉熵,而是在MSE的基础上基于层级标签的依赖信息设计出针对不同预测结果的惩罚系数体系。因为传统的层级多标签分类算法往往忽略层级依赖信息,而采用拍平的思路或者采用大规模应用并不高效的集成算法。我们提出的方法在增加少量参数的情况下提高了分类的精确度和运算效率,更适合金融领域的实际应用。


1588749397570095439.png



文案 | 梁鑫

排版 | 施若男