2024年5月11日发(作者:)

ODI工具抽取数据操作手册

一、准备工作(以ORACLE 11G为例)

1、ODI是oracle的数据抽取工具,需要自行安装oralce数据库。

2、请按照ODI安装说明书安装rcu资料库和ODI工具。

ODI11G安装及使用_百度文库:

/link?url=HSHQvFYg5Vu-Z4aPJ_7Bm2bCRKx

nANKLDpCF91yjrD8G0xFmGZ_iu2M0Z8yhLTP_6ULJlUK7GLSsYQNlsuhAXJ

KY5FAhvV-jIC0hWeSToxe

3、理解:资料档案库

资料库分两种:

(1)Master Repository(主资料库),保存企业所有IT资源的Topology,保

存项目和数据模型的安全信息、版本信息,供ODI图形模块等使用。通常创建一

个即可。Master Repository要尽可能独立存储,单独的Instance,或单独的

Schema。

(2) Work Repository(工作资料库),保存项目和数据模型,供ODI图形模块

等使用。可创建多个。一个Work Repository只能连接一个Master Repository。

一个Schema只能存储一个Work Repository,不过Master Repository倒可与

其安装在同一Schema。

4、Topology

1

Topology Manager(拓扑管理器)主要用来管理下面5类任务,并将

信息存储在主资料库中,供所有模块共享使用。

(1)物理体系结构,定义各种技术及其数据服务器、物理架构、物

理代理。

(2)逻辑体系结构,定义各种技术及其关联的逻辑架构、逻辑代理。

(3)上下文,用来连接物理架构和逻辑架构。

(4)语言,不同技术所能采用的语言特性。

(5)资料库,包含主资料库及其附属的工作资料库。

5、知识模块

Oracle Data Integrator之所以能适应不同的、多种多样的数据源,

灵活有效的完成数据抽取/转换/载入的过程,均是基于其知识模型体

系。 Knowledge Modules类似于程序中的插件,Oracle Data

Integrator将数据整合的任务抽象出六个组成部分:

(1)反向工程RKM,Reverse-engineering knowledge modules,用

于从数据源读取表及其他对象。

(2)日记JKN,Journalizing knowledge modules,用于为单一或一

组表/视图记录新建的和修改的数据。ODI支持部分数据源的Change

Data Capture(CDC)功能,前提为ODI项目中启用该模块。

2