|
Extract/Transform/Load(略称:ETL)とは、データウェアハウスにおける以下のような工程を指す。 * Extract - 外部の情報源からデータを抽出 * Transform - 抽出したデータをビジネスでの必要に応じて変換・加工 * Load - 最終的ターゲット(すなわちデータウェアハウス)に変換・加工済みのデータをロード ETLは、データウェアハウスにデータを実際にロードする方法として重要である。ETLという用語はデータウェアハウスでのデータのロードだけでなく、任意のデータベースでのロード工程を指すこともある。ETLはレガシーシステムとの統合にも使われる。通常のETL実装は、処理についての監査証跡を記録する。ほとんど全ての設計において、この監査証跡は、元のデータが利用不可能な場合にETLの結果を再現できるほどの細粒度のレベルにはなっていない。 == 抽出 (Extract) == ETL工程の第1の部分は、情報源となるシステムからデータを抽出することである。たいていのデータウェアハウス構築では、複数の情報源からデータを集積する。個々のシステムはデータの構成やフォーマットが他とは異なる可能性がある。典型的な情報源のデータフォーマットとしては関係データベースやフラットファイルがあるが、IMSのような非関係データベース構造や、VSAM や ISAM といった他のデータ構造もある。抽出においては、次の変換・加工工程に適したフォーマットに変換する。 抽出の本質は、抽出したデータの構文解析であり、それによってデータが期待したパターンや構造に適合しているかどうかを調べる。適合していない場合、データは抽出対象から除外される。 抄文引用元・出典: フリー百科事典『 ウィキペディア(Wikipedia)』 ■ウィキペディアで「Extract/Transform/Load」の詳細全文を読む 英語版ウィキペディアに対照対訳語「 Extract, transform, load 」があります。 スポンサード リンク
|