全部文档
当前文档

暂无内容

如果没有找到您期望的内容,请尝试其他搜索词

文档中心

建立模型

最近更新时间:2022-07-21 07:11:43

新建模型

连接完数据、完成数据准备后,用户便可以将需要的多张数据表关联成一张表,并进行需要的数据处理,建立数据模型以进行后续的数据可视化分析工作
下面我们分步骤介绍:

1、在“数据源”模块,添加数据模型
image.png
2、选择需要的数据连接,基于该连接建立数据模型
image.png
3、选择需要的一张或多张数据表,若选择多张数据表,则需要关联成一张宽表
image.png
拖入两张表时,若它们在原数据库中存在外键关联,则会自动进行关联;若无外键,系统会自动将两张表中相同名称的列设置为外键进行关联。用户也可以手动添加或修改“关联字段”。

image.png
完成关联后,下方会显示宽表中的所有字段,并将字段划分为维度、度量两种类型进行展示。
image.png
当基于数据库(比如MySQL、Oracle)类型的数据连接建立数据模型时,可以在有数内通过SQL语句建立自定义视图。
image.png
4、如果需要,可对字段进行处理,比如创建计算字段
image.png
5、保存后完成数据模型的建立
image.png

模型设置
用户可以对模型的连接方式,应用范围,是否同步复杂报表,缓存有效期进行设置。
image.png
对于连接方式为直连的模型,可以在更多内开启缓存有效期的设置。
image.png
开启后缓存有效期设置后,可对缓存时间进行设置,时间单位包括时、分、秒。
image.png
缓存规则:
首次访问后会对数据进行缓存,缓存有效期内,再次访问会直接访问缓存数据。当到达缓存失效时间点后,缓存被丢弃,之后再访问时,则需重新访问数据库获取数据并重新缓存。
例如,若首次访问时间为“08时36分”,缓存有效期设置为“3小时”,则缓存的数据会在下一个三小时整数倍时间点失效,即“09时00分”失效。若缓存有效期设置为“6小时”,则缓存的数据会在下一个六小时整数倍时间点失效,即“12时00分”失效。若缓存有效期设置为”24小时“,则当日首次访问后缓存的数据,会在当日凌晨00时00分失效,这期间查看报表都会访问缓存数据。
###表关联
在数据模型中进行表关联时,支持用户对某个数据连接的多个表进行关联,也支持用户对多个数据连接中的表进行关联。

跨数据连接关联表
产品支持将不同数据连接中的表进行关联,比如一张数据表来自MySQL数据库,一张数据表来自Excel文件,要将两张数据表关联成一张宽表后分析。此时需要将不同数据连接的表抽取至产品提供的MPP数据库中
image.png
我们还可以通过“抽取设置”对抽取任务进行更灵活的设置,比如设置抽取方式,建表方式,抽取引擎,执行计划,详见数据连接方式
image.png
表关联方式

关联类型 说明 示意图
内关联 使用内关联来合并表时,生成的表将包含与两个表均匹配的值。 image.png
左关联 使用左关联来合并表时,生成的表将包含左侧表中的所有值以及右侧表中的对应匹配项;当左侧表中的值在右侧表中没有对应匹配项时,您将在数据网格中看到 null 值。 image.png
右关联 使用右关联来合并表时,生成的表将包含右侧表中的所有值以及左侧表中的对应匹配项;当右侧表中的值在左侧表中没有对应匹配项时,您将在数据网格中看到 null 值。 image.png
外关联 使用完全外部关联来合并表时,生成的表将包含两个表中的所有值;当任一表中的值在另一个表中没有匹配项时,您将在数据网格中看到 null 值。 image.png

表处理

在进行对表的处理前,我们首先需要了解有数BI划分字段的方式。

名词解释
**维度:**观察数据时,使用的粒度

**度量:**汇总的统计值

**聚合方式:**汇总的方式,比如求和、求平均、最大值、最小值

怎么理解呢?假设我们有一份明细的订单交易数据,部分数据如下:
image.png
将这份数据导入有数后,我们可以用不同的粒度观察数据,有数会自动替我们进行汇总。

比如,观察“各地区的销售额”,“地区”是维度,“销售额”是度量。每个地区都对应成百上千行数据,有数对这些数据进行了求和汇总。如下图所示:
image.png
我们也可以观察“各省的销售额”,“省/自治区”是维度,“销售额”是度量。如下图所示:
image.png
数据导入有数后,默认会把字符型的字段归类为维度,数值型的字段归类为度量,用户也可以手动更改字段的类型。

字段配置
在数据模型中,用户可以对字段进行可见性操作,重命名,复制字段,转换数据类型,数据格式设置,数据字典设置,创建层级,创建组,度量/维度转换,设置指标,新建计算度量。用户可以批量进行操作。

  • 批量编辑字段
    点击批量编辑字段,用户可以对字段属性等进行批量操作。
    image.png
  • 批量设置数据格式
    点击批量设置数据格式,用户可以对数据格式进行批量操作。
    image.png
  • 设置指标
    支持用户可以通过指标系统与自定义两种方式配置指标名称、业务与技术口径。
    image.png
  • 数据字典
    数据字典用于修改离散字段成员的名称,只针对维度类型的字段,具体介绍可以查看数据字典
  • 层级创建
    用户可以为不同的字段之间创建层级关系,具体可以查看层级
  • 创建组
    用户可以为一个维度字段中所有的成员自定义组别的划分,新的划分会作为一个新的维度字段而存在。具体可以查看创建组
文档导读
纯净模式常规模式

纯净模式

点击可全屏预览文档内容
文档反馈