
白雪,熊昊,白硕
上海阡寻信息科技,上海 201203
E-mail :evywhite@163.com
抛开应用场景的数据解决方案通常都不能取得良好的效果,就针对证券行业这一特定行业而言,存在着结构与非结构化数据并存、数据分析结果要求准确度极高、数据分析结果经济效益明显直接的特点,对我们的分析手段提出了新的要求与挑战。
金融知识图谱,一改传统数据分门别类的存储方式,以一种“活”的方式将实体、属性、关系等非结构化、结构化数据固化并联系起来。构建金融知识图谱作为证券文本语义理解和知识搜索的关键基础技术,为未来证券领域文本分析、舆情监控、知识发现、模式挖掘、推理决策等提供了坚实支撑。
金融知识图谱在证券行业的应用目前尚处于探索阶段,如智能投研,智能公告等等,均可以大大提高传统业务效率。然而,构造和应用领域知识图谱,尚面临着各种挑战和难题,需要行业专家和人工智能专家协作起来,以专家+大数据的方式构筑自生长模式,从而真正将海量非结构化信息自动化利用起来,成为领域应用决策的坚实支持。
关键词:知识图谱; 智能投研; 大数据;
1 引言
一部2009年上映的科幻巨作《阿凡达》,以智慧之树的形式承载并实现了历史知识、记忆和现实生灵的万物互联,形象而精准地预测了知识科技的今天:人工智能领域顶尖的工程师,与行业资深专家,正携手致力于基于知识图谱、深度学习、自然语言处理等前沿技术,融合各行各业的知识归集与建模,共同构筑连接万物的知识之网、智慧之树。
知识图谱作为一种的知识表示形态,本质上是一种语义网络。语义网络的核心是以图的方式存储知识并向用户返回经过加工和推理的知识。知识图谱的研究和应用,可分为基于广度的通用知识图谱和基于深度的领域知识图谱。通用知识图谱,主要由各大搜索引擎公司,如Google、百度、搜狗等领衔研究,主要目的是改善搜索体验,直接给出目标答案;而领域知识图谱,则可根据领域特定的情况,有着变化万千的应用。本文将主要讨论领域知识图谱在证券行业的研究和应用。
现代信息技术人工智能的发展,已经可以在很多方面提高信息分析和利用的效率。对结构化数据的分析挖掘,已经取得了很多进展,很多成熟的分析预测算法还是针对结构化、关系型数据的。然而,非结构化数据的分析挖掘和利用,尚处于起步阶段。什么是关系领域知识建模在方法论上的正确性,是决定人工智能应用成功与否的最关键因素。当前“知识图谱”作为领域知识建模的工具正在受到越来越多的重视。基于知识图谱的领域建模、基于规模化大数据的处理能力、针对半结构化标签型数据的分析预测算法三者的结合,是人工智能的优势所在[1]。构建证券领域知识图谱作为证券文本语义理解和知识搜索的关键基础技术,为未来证券领域文本分析、舆情监控、知识发现、模式挖掘、推理决策等提供了坚实支撑。

2 金融知识图谱技术实践
金融领域的知识图谱,与其他领域图谱相比有着很大的不同。金融领域本就是连接各行各业,世间万物的,因此金融知识图谱中涉及到经济、投资、产业、公司等相关的知识,其实是覆盖全行业的。但金融领域知识图谱,与通用型/百科类知识图谱不同,其行业、产业链知识,经济金融重要指标等大多是以投资的视角来筛选和组织的。


建立金融知识图谱可分为几个步骤:
(1)从海量异构非结构化数据中辨别金融实体;
(2)定义并挖掘金融实体间的各种关系,从而生成知识图谱;
(3)定义并表达业务逻辑,在知识图谱上实现各种具体任务,如推理等等。

实体-关系抽取
实体-关系抽取技术,是信息抽取研究中的重要课题。其主要目的是将非结构化的文本数据转化为结构化或半结构化信息。即:从文本中抽取出特定的实体(Entity)信息,如时间,人物,地点,公司,产品等等;以及实体间的各种关系,如地理位置关系,雇佣关系,股权关系等等。实体确定了知识图谱中的点,而关系则确定了点与点之间的边。
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-67261-1.html
知道为什么中共对所谓的岛内运动不屑一顾吗
有高有低