基于文本数据的金融风险防控 知识图谱构建技术框架指南

  

  2017 年 7 月 14 日-15 日召开的全国金融会议中强调防止发生系统性金融风险是金融工作的永恒主题。要把主动防范化解系统性金融风险放在更加重要的位置,科学防范,早识别、早预警、早发现、早处置,着力防范化解重点领域风险,着力完善金融安全防线和风险应急处置机制。而如何科学的对金融风险进行监测是预防系统性金融风险的关键所在。

  与此同时,伴随着互联网和信息技术的发展及普及,每天正在产生数以万计的庞大数据,而这些数据往往不是以符号数字的形式存在,而是以文本的形式存在。文本数据的背后隐含着对金融机构、企业、个人日常经营活动、行为、舆情等方方面面的映射。当然风险信号也隐匿、散落在这些文本数据的各个角落之中,如何在文本数据中有效的提取知识,并将看似独立的知识节点通过挖掘分析串联在一起从而形成知识的可视化感知和立体化透视是“实现基于文本数据的金融风险监测”的关键技术路径。

  由上分析可见,在互联网及信息大爆炸的当下,基于文本的金融风险知识图谱技术对预防系统性金融风险有着较大的影响。而此技术近两年在大型的金融机构及创新意识较强的中小型金融机构已有落地应用并呈现爆发式增长趋势。目前还未见对此技术给出标准及规范性的描述说明。基于此,“基于文本的金融风险知识图谱框架技术规范”即有利于给金融机构技术选型起到指导意义,又有利于当前市场上的金融信息服务提供商提供更合适的技术产品,也便于相关监管部门制定统筹监管措施。

  主要技术内容包括:

  标准范围、规范性引用文件、标准涉及的术语和定义、功能架构、功能要求、规范性附录、参考文献。

  

  

  知识图谱整体架构

  知识图谱整体架构按照数据流转方向自下而上包含数据源层、数据加工层、知识管理层、分析挖掘层、风险防控应用层和开放服务交互层。

  4.2 数据源层

  数据源层是知识图谱构建所需数据的最初来源。从数据源渠道角度,可分为金融机构内

  部数据源与外部数据源;从数据形态角度,可分为结构化数据和非结构化数据。

  4.3 数据加工层

  数据加工层将数据源层的各类型数据通过数据甄别、数据清洗、数据转换和数据融合等

  步骤,加工形成满足检测标准的数据。

  4.4 知识管理层

  知识管理层将数据加工层形成的数据作为输入,通过图数据存储、全文检索引擎、属性

  数据存储和元数据配置管理等模块化处理,实现知识图谱展现结果的有效管理和高效访问。

  4.5 分析挖掘层

  分析挖掘层在知识图谱展现结果的基础上,统计分析和构建图算法模型,形成具有特定

  模式的标准化的图分析挖掘结论,服务后续应用场景构建与求解。

  4.6 风险防控应用层

  风险防控应用层面向金融业务场景,利用分析挖掘结论,分析推演风险成因、性质、等

  级,形成对风险的识别、预警和处置策略。

  4.7 开放服务交互层

  服务交互将风险防控应用层推演出的风险结果及处理机制规范化成可供各种终端或其

  他相关系统使用的服务,实现知识图谱风险防控方法和技术的开放性。

  参考链接:

  http://std.samr.gov.cn/gb/search/gbDetailed?

  id=CA850F3BFAA1C605E05397BE0A0AF16F

  知识图谱AI大本营

  知识图谱AI大本营 是一个追踪、解读、讨论和报道知识图谱、深度学习、机器学习等AI前沿成果的学术平台,致力于让人工智能领域的国内外优秀科研工作者们得到交流学习的机会。