面试针对性准备(二)

  OLAP分析

  提供给用户观察事实的多个视角,而且还能够在维度的不同层次之间进行不同粒度数据的聚集探查,即进行上卷(roll up)和下钻(drill down)。

  ↑

  构建多维模型时要构建每个维度的层次结构

  立方体的定义与计算

  OLAP多维分析选择某些维度中的某些层次,交互式地探查某些度量取值的过程。

  一般可以选择分析问题的三个维度构造为立方体后,按照两个维度、一个维度等进行汇总形成最终数据的立方体。

  OLAP多维分析对立方体的数据进行切换,交互式地探查不同维度组合的业务指标,发现其中存在的问题。

  计算中的快速响应

  物化:将计算好的立方体数据存放于物理存储设备中,有不物化、完全物化、部分物化三种策略。

  OLAP多维分析

  操作类型:切片、切块、上卷、下钻、旋转

  切片:从m个维度中选择一个维度的一个属性,查看其他维对应度量取值的过程。

  切块:固定某一维的取值为其中一个属性的某个区间,保持其他维不变。取三个维中部分或者全部类别,固定其他任何维的取值为其中的一个类别后得到的三位立方体视图。

  上卷:数据汇总——立方体数据一个维度的层次用其上层的属性代替;减少一个维度。

  下钻:不断观察细节——立方体数据一个维度的层次用其下层的属性代替;增加一个维度。

  旋转:调换已有维度的位置。用其他维度代替其中一个维度,改变观察业务的角度。

  发现异常是解决问题的一种方法。

  爬虫

  微博爬虫分享

  (爬虫实战与具体操作分析在稍后的博文中会具体涉及)

  CRF和BiLSTM

  百度百科