常见问题

最近更新时间:2019-12-20 14:15:47

  1. 什么是数据开发?数据开发包含哪些功能?

数据开发是大数据云提供的一套离线数据脚本处理方法,全称为离线数据开发。提供了Shell,Spark SQL,Spark SQL,Python 2.7,Python 3.6,Perl以及作业模板等插件功能。帮助用户在线进行脚本开发、测试、提交、发布上线等一整套流程。

  1. 目前数据开发脚本插件支持哪些数据源?

特定类型的脚本插件支持特定类型的数据源。目前不同脚本的数据源支持情况如下:

  • Spark SQL:default HIVE数据源
  • Spark Shell:MySQL、Oracle数据源
  • Shell:不支持选择数据源
  • Python2.7\Python3.6:MySQL、Oracle数据源
  • Perl:MySQL、Oracle数据源
  1. 数据开发支持的插件哪些是大数据类,哪些不是大数据类?

在插件中,大数据类插件包括:Spark SQL,Spark Shell。非大数据类插件包括:Shell,Python2.7\Python 3.6,Perl。运行大数据类作业主要使用CU资源,运行非大数据作业主要使用DCU资源

  1. 数据开发对于作业的版本是如何管理?

数据开发过程中提交/发布操作等都是以作业流的粒度进行操作,用户提交作业流时选择作业流内需要提交的作业,被提交的作业就会生成一个新的版本。可以选择两个版本进行版本间差异对比。也可以进行历史版本的回退操作。

金山云,开启您的云计算之旅

注册有礼