3 应用场景及展望
知识图谱在金融、证券行业应用目前在国内尚处于起步阶段。如果能基于知识图谱技术框架,建立起建立一个全谱系的上市公司关联图,并将其直接关联、间接关联的各种实体、概念相联系,将极大的帮助证券行业监管层、投资者及其他各种参与者了解并把握市场的脉搏。而在具体业务应用方面,当监控到市场价格出现波动时,可以就股价出现异动的股票在知识图谱中追溯其异动产生的根源;挖掘学习实体之间的隐含关系,来发现潜在的关联与协同动作以预防并打击违法违规行为;自动学习并抽取公告摘要,快速传递并汇总全市场披露的动态信息,以减少信息不对称性并加强证券市场的透明度。
下面以智能投研为例,阐述金融知识图谱在其中起到的重要作用。什么是关系
这里的智能投研,其定义参考文献[2]“使用人工智能技术进行市场数据及基本面分析并向顾客推送分析结果”,属于广义的智能投顾。其中,使用人工智能技术进行与客户的自然语言互动(即“智能客服”),也可基于同一套技术体系。
智能投研专注于对信息特别是基本面信息的采集和分析。这一领域的技术发展,经历了基于热词、基于情感倾向和基于领域知识图谱三个发展阶段。基于热词的基本面分析,从后验看确实在一些局部做到了先知先觉,但是事前很难知道是哪些局部,所以实用性并不强。自从学术界发现了Twitter上的舆情统计指标与大盘的高度相关性,基于情感倾向的智能投研技术开始逐步向实用环节有所渗透,但投资团队对这种技术并不满意,因为大多数情况下,情感倾向的指向性并不精准,而无情感倾向的事实陈述(比如天气状况)却可能经过产业链的传播,在意想不到的落脚点(比如期货)产生对投资判断的关键影响。所以,对智能投研技术的实用化来说,自然语言处理和产业链、作用链的知识图谱建模是最关键的技术[2]。
具体而言,通过构造上下游产业链知识图谱,基于经济基本面建立传导模型。当产业链中重要节点的状态发生变化时,将启动沿产业链传导推理引擎,自动给出影响范围、对象和程度,为事件引发的基本面分析做支持。这种做法,其实是Fundamental analysis 向Quantamental 形式的转变,把基本面数据以及逻辑进行量化。不同于技术分析,基本面分析本身是一个非结构化的方式,无论是数据,还是市场逻辑。基于金融知识图谱和推理逻辑,把这些基础数据进行整合加工,从而找到未来趋势的变化或者解释已经发生过的事情。从局部来看产业链知识图谱,里面各种实体、属性、关系,就像活细胞一样,相互关联影响作用着。 这是金融知识图谱+推理链的共同作用的效果。图5为橡胶-轮胎-重卡产业链局部。当发生“重卡销量大增”事件时,可沿产业链向上游进行传导推理,并生成分析影响报告。


基于金融知识图谱,还可在智能公告方面展开应用:上市公司公告,是上市公司信息披露尤为重要的组成部分,即时披露了上市公司的最新动向以及各种属性变动。因此,基于公司基本属性与关联关系所生成的知识图谱,更多的是描述某一个时刻公司的整体状态;而公告知识图谱,则是各种事件/概念的集合。前者以现实世界中的真实实体为主,建立实体间关联,并维护其属性值;后者则以事件和概念为主,描述了各种事件的组成部分,包含了哪些主要概念,涉及到哪些重点披露的属性。这两者之间存在着关联和映射的关系,其相对应的属性值可依据关联做交叉验证和时序演化,需研发跨领域图谱关联分析和挖掘算法。具体应用方面,可以做公告摘要、关键词抽取、事件统计、事件演化、关联挖掘等等。

总的来说,基于金融知识图谱的应用,有如下三大特点:
(1)广覆盖
广泛覆盖全量信息源,覆盖宏观、中观、微观各维度信息,覆盖上市及非上市公司,以方便后续算法拓展所有可能的深度关联关系。
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-67261-3.html
但每个国家都有一些不好的地方