応用 情報 データディクショナリ

応用 情報 データディクショナリ

本記事は教養記事シリーズその49です。その他の教養記事は【超初心者向け】3分で分かる!教養記事シリーズ目次をご覧ください。

★この記事の流れ★

メタデータ
データディクショナリ
データディレクトリ
分散データベース
集中管理方式
分散管理方式

本記事は初学者の理解を優先しているため正確性に欠ける場合があります。致命的なミスはご指摘いただけますと助かります。

データディクショナリ

応用 情報 データディクショナリ
データベースを利用するときはメタデータが必要になる

システムで扱うデータの定義をまとめた辞書のことを,データディクショナリと呼びます。DBMS(データベースを便利に扱うためのシステム)では,データとメタデータをセットで扱うことが多いため,データディクショナリのようなメタデータが必要になるのです。

メタデータとは,データの属性や格納場所などを表した,「データについて記述したデータ」のことを指します。

ちなみに,データディレクトリというのは,データディクショナリをコンピュータ用に翻訳したメタデータになります。レポジトリというのは,メタデータを集中的に管理するデータベースのことを指すことが多いです。

分散データベース

応用 情報 データディクショナリ
みんなで協力してデータベースを管理しよう

普通は,各サイトでメタデータを保管するのですが,メタデータをより効率よく管理するために,メタデータを分散させて管理する方法があります。これを,分散データベースと呼びます。

この方式では,どのサイトからもアクセス可能な状態でメタデータを保管することで,ネットワークの特性を生かしたメタデータの保管方法が可能になります。言い換えれば,各サイトは,どこからでもアクセス可能なグローバルなデータディクショナリ/ディレクトリ(DD/D)を用意する必要があります。

グローバルなDD/Dの設置方法は,大きく2つに分けられます。まず,1つのサイトに集中してDD/Dを管理させる「集中管理方式」が挙げられます。次に,複数のサイトに分散させてDD/Dを管理させる「分散管理方式」も挙げられます。特に,分散管理方式では,各サイトが持つ情報に重複がある場合と,ない場合で分類されることもあります。

応用 情報 データディクショナリ
集中管理方式

各サイトが重複を許して自分に関係のあるメタデータだけを保持すれば,必要な情報はすぐに手に入ります。一方で,データベースの更新をする際には,他のサイトが自分のデータを保持している可能性があるため,全てのサイトでDD/Dを修正する必要があります。

応用 情報 データディクショナリ
分散管理方式(重複あり)

一方,各サイトが重複をせずにDD/Dを保持していれば,データベースの更新は自分の保持しているデータだけでOKなのですが,手に入れたい情報を他のサイトに問い合わせる必要があります。これらの特性を踏まえて,データベースの設計を行う必要があります。

応用 情報 データディクショナリ
分散管理方式(重複なし)

ひとこと

データベースの保管方法は,よくある「集中 vs 分散」の議論でした。リスクを取るか,効率を取るかといったところでしょうか。また,効率と一口には言っても,どの場面で効率を重視するかによって,ディクショナリの保持様式が変わるのですね。

応用情報の参考書ならコチラをどうぞ!

応用 情報 データディクショナリ

¥4,279
(2022/11/25 10:19:44時点 Amazon調べ-詳細)

ABOUT ME

情報処理技術者試験での学習内容

【応用情報】
・データベースの応用対象,応用方法を修得し,応用する。
・分散データベースの特徴,機能を修得し,応用する。
・データ資源管理の仕組みとして,リポジトリ,データディクショナリを修得し,応用する。

【基本情報】
・データ分析,業務システム,ソフトウェア開発と保守などに,データベースがどのように応用されているかを理解する。
・分散データベースの特徴,利点,留意事項,データ同期の仕組みを理解する。
・データ資源管理のあらましを理解する。

(1)データベースの応用 基本情報 応用情報

データウェアハウス,データマート,OLAP(Online Analytical Processing),データマイニングなど,データを分析して有効活用する技術の特徴,これらの技術が企業会計システム,在庫管理システムなどで使われていること,その応用方法を理解する。

用語例:OLTP(Online Transaction Processing),ETL(Extract/Transform/Load),データクレンジング,ビッグデータ,文書管理システム,営業支援システム

(2)分散データベース 基本情報 応用情報

複数のサイトに配置された分散データベースの特徴,利点,取り扱う上での留意事項,サイト間でのデータ同期の仕組み,関連する機能,集中型データベースとの違いを理解する。

透過性,クライアントキャッシュ,コミットメント制御,2 相コミットメント,コミットシーケンス,同時実行制御,レプリケーション,水平分散,垂直分散,表の分散(水平,垂直),分散問合せ,結合演算,分散トランザクション,OSIRDA(Open Systems Interconnection-Remote Database Access:開放型システム間相互接続-遠隔データベースアクセス)プロトコル

(3)データ資源管理 基本情報 応用情報

データの属性,意味内容,格納場所など,データを管理するための情報(メタデータ)を収集,管理したデータディクショナリや,ソフトウェア開発と保守における様々な情報を一元的に管理するリポジトリを理解する。

IRDS(Information Resource Dictionary System:情報資源辞書システム),ファクトデータベース,リファレンスデータベース,データベースサービス