ODPS到ADS数据迁移指南

  • 时间:
  • 浏览:0
  • 来源:大发彩神下载—大发彩神APP

选泽目录:任务开发中选泽您所使用的文件夹中要同步的任务。



1.登录Base管控台,单击顶部菜单栏中的项目管理,并选泽相应的项目。

l  ODPS项目名称与计算引擎配置中的ODPS项目名称相同。

l  数据源类型:当前选泽的数据源类型ODPS。

测试运行是手动触发任务执行,任务调度的时间到了,就自动运行,无视实例的上游依赖关系。

Ø  数据抽取

  导入规则是追加写入:源表中新增的数据,同步后要同步过去;当是批量导入时目标表与源表有主键相同数据我不要 导入成功。

路径:运维中心-〉任务管理-〉任务运维视图下查找对应时间对应任务的运行情况汇报和检查节点运行日志。

名称: 起有另一有一个 好识别的名称,符合命名规则即可;

l  数据源名称:由英文字母、数字、下划线组成且需以字符或下划线开头,长度不超过100个字符。

l  ODPS Endpoint:默认只读。从系统配置中自动读取



2. 进入数据源配置,单击新增数据源

3. 在新建数据源弹出框中,选泽数据源类型为ODPS;

4. 单击测试连通性。

数据同步节点任务是阿里云大数据平台对外提供的稳定高效、弹性伸缩的数据同步云服务。ODPS到ADS数据迁移采用CDP的最好的法子同步数据。

配置项说明(上图中带*的都都要输入相应的信息):

l  AccessID/AceessKey访问密钥 AccessKeyAK 大约登录密码。



新建任务配置项说明(*项都都要输入或选泽



新建任务创建好保存后,会产生有另一有一个 周期调度,默认的时间是每天晚上00:00执行。客户也可根据实际的同步场景进行时间配置。下图所示是默认的配置

l  数据源名称:由英文字母、数字、下划线组成且需以字符或下划线开头,长度不超过100个字符。

导入规则

 5.流量与出错控制



覆盖写入或追加写入



Ø  加载控制

l  数据源描述:对数据源进行简单描述,不得超过100个字符。

l  数据源类型:当前选泽的数据源类型ADS。

初次在同步数据前都要在源库和目标库创建好相应的表型态。

配置项说明(上图中带*的都都要输入相应的信息):

2. 根据跳转页面的提示,单击确认运行

全量同步时过滤条件为空;增量同步时可按时间进行数据的抽取。



1. 新建同步节点,如下图所示:



若测试运行只都要运行一次,测试运行完成后都要在调度情况汇报前打勾暂停掉此任务。

l  连接UrlADS连接信息,格式为:serverIP:Port

3.字段配置

肯能越来越 配置上游任务,则当前任务默认由项目一种触发运行,故在调度系统中,该任务的上游默认为 project_start 任务。每有另一有一个 项目中默认会创建有另一有一个 project_start 任务作为根任务

说明:

l  Schema相应的 ADS Schema 信息。

覆盖写入或追加写入



当源表和目标表型态一致时,默认的源和目标表字段是一一对应的关系,我不要 做任何设置。如下图所示:

 

实时更新



3. 在新建数据源弹出框中,选泽数据源类型为 ADS,配置ADS数据源的各个信息项。

5. 测试连通性通然后,单击选泽。





1.单击工作流页面中的测试运行按钮,如下图所示:



4. 数据抽取和加载控制

2.进入数据源配置,单击新增数据源

ADS表更新最好的法子

  依赖属性中里可不可否 配置任务的上游依赖,表示即使当前任务的实例肯能到定时时间,也都要在等待上游任务的实例运行完毕才会触发运行。

 作业下行下行速率 上限是指数据同步作业肯能达到的最高下行下行速率 ,其最终实际下行下行速率 受网络环境、数据库配置等影响。

批量更新

  导入规则是覆盖写入:目标表所含与源表累积相同的数据,覆盖写入会对相同的数据覆盖写入;

其中:数据来源指的是数据源,数据流向指的是目标数据源。



5. 测试连通性通然后,单击选泽。

    周期自动运行,由系统根据所有任务的任务调度配置自动触发。前往运维中心查看任务运行情况汇报和检查运行日志。

 加载控制中的导入模式与ADS表更新最好的法子要对应;建议导入规则用覆盖写入。

说明:

依赖属性配置:

l  AccessID/AceessKey访问密钥 AccessKeyAK 大约登录密码。

 3.单击前往运维中心查看任务运行情况汇报和运行日志,如下图所示:

实时导入

1.登录Base管控台,单击顶部菜单栏中的项目管理,并选泽相应的项目。

导入模式

4. 单击测试连通性。

类型:选泽数据同步;

批量导入

任务类型为工作流任务可一次性调度或周期调度;节点任务越来越 是周期调度;

2.选泽数据来源和目标

l  数据源描述:对数据源进行简单描述,不得超过100个字符。