IT情報バンク

IT information Bank

7.1 ユーザの管理とセキュリティの管理

Oracleデータベースを使用する際に、データベース管理者がはじめにデータベースにユーザアカウントを作成する必要がある。 作成したユーザごとに、データベース内で行うさまざまな操作権限を付与する必要がある。データベースにア […]

8.3 表へのデータロード

Oracleシステムでは、SQL *Loader(エスキューエルローダー)と呼ばれるユーティリティを使用して、外部ファイルに保存されている大量のデータをバッチ処理で表にロードする(取り込む)ことができる。SQL * Lo […]

8.2 スキーマオブジェクトの追加作成

氷以外のスキーマオブジェクトである、索引、ビュー、ストアドプログラムについて ■索引 索引は、検索時のディスク1/Oを減らし、表データの検索を高速にするために作成するオブジェクトです。 索引の役割は、書籍の巻末に付いてい […]

10.2 パフォーマンスの問題の診断

■AWR(自動ワークロードリポジトリ) パフォーマンス情報は、SQG上にあり、流動的に変化するため、データベースにそれら情報を蓄積保存し、後から、比較参照することができる。 データベースは、データベースの状態とパフォーマ […]

10.1 データベースの監視およびアドバイザの使用 Oracle自己監視アーキテクチャ

Oracleデータベースでは、データベースを停止させないためのさまざまな機能が搭載されている。データベースによる自己監視に基づいて機能している。 ■Oracleの自己診断エンジン Oracleデータベースによる自己監視は […]

9.3.2 フラッシュバック表

データ障害は、ディスクやファイルの破損だけが原因ではありません。表のご削除といった人為的ミスによる損失もかなりの確率で起こります。 人為的ミス、人為的エラーによって、失われたデータは、Oracleデータベースに用意されて […]

9.3 リカバリの実行

■Oracle社推奨のリカバリ Oracle社推奨のリカバリ方法は、データリカバリアドバイザというツールを使用します。 データリカバリアドバイザとは、データ障害を自動的に診断した上で、適切な修復オプションを表示する機能で […]

9.2.5 バックアップの管理

データベース管理者は、RMANで取得したバックアップに関して、ディスクまたは、テープ上に取得したバックアップファイル自体が正常であるか、リカバリに必要な要件を満たしているかなどを検証する必要があります。 また、RMANリ […]

9.2.4 推奨バックアップ計画の使用

Oracleの推奨バックアップ計画を使用すると、増分更新バックアップ機能を利用した自動バックアップ計画を実装する、効率的なバックアップとリカバリが可能になる。 増分更新バックアップ機能とは、データファイルのイメージコピー […]

9.2.2 バックアップ設定の構成

RMANでは、バックアップに関する設定および、バックアップ方針を構成できる。 ■RMANの設定を表示する 現在のRMANの設定内容を表示するには、RMANプロンプトでSHOW ALLコマンドを実行する。 ■ディスク設定 […]

9.2 バックアップの作成および管理

RMAN(Recovery Manager)を使用して、バックアップを作成し、それを管理する方法について ■バックアップの分類 RMANがサポートしているバックアップファイルの種類、および、バックアップの対象について ▼ […]

9.1.5 バックアップおよびリカバリを自動管理するためのデータベース構成

Oracleデータベースには、バックアップやリカバリのファイル管理を簡略化するための機能として、高速リカバリ領域が用意されています。 k高速リカバリ領域をバックアップのためのファイル格納用の領域にすると、バックアップファ […]

9.1.4 Oracleデータベースのリカバリ機能

Oracleデータベースでは、3種類のリカバリ機能(インスタンスリカバリ、メディアリカバリ、フラッシュバック)があります。 ■インスタンスリカバリ(クラッシュリカバリ) インスタンスリカバリは、インスタンス障害の発生時点 […]

9.1.3 バックアップのタイプ

トランザクションの一貫性という観点から2つのバックアップタイプがある。 ■一貫性バックアップ(オフラインバックアップ) 一貫性バックアップ(オフラインバックアップ)とは、コミットされた全ての変更内容がデータファイルに書き […]

9.1.2 データベースのリカバリとは

データベースのリカバリとは、リストアしたデータファイルにREDOログファイルを適用することで、データファイルに反映されていない変更情報を反映していく作業のことです。 REDOログファイルには、バックアップ以降、現在までの […]

9.1 バックアップおよびリカバリの概要

データベースには、ハードウェアの障害やユーザのオペレーションミスなどによって、データベース障害が発生する。 その際の備えとして、失ったデータの復旧機能が複数用意されている。 バックアップは、データを再構築するために使用で […]

SQLの分類

SQLは、 データ操作言語(DML) データ定義言語(DDL) データ制御言語(DCL) トランザクション制御 の4つに分類される。

主キーと外部キー

▼主キー 主キーは、表の中の行を一位に識別するための列(または、列の組み合わせ)を指します。 主キーには、重複した値やNULL値をセットすることができません。 主キーは、1つの表に1つだけ設定できます。 ▼外部キー 外部 […]

リレーショナルデータベース用語

▼表(TABLE) リレーショナルデータベースの基本的な記憶域構造。 表は列の集合と表名で定義される。 ▼行(ROW) 表に格納されている1件1件のデータ単位。レコードとも呼ぶ ▼フィールド 行と列が交差する「値を格納す […]

リーレーショナルデータベースとは

データベースとは、さまざまなデータを一定の規則に従い、格納し、効率よく利用できるようにしたものです。 リレーショナルデータベースの構造 ・表(リレーションの集合) ・表を管理するための一連の演算子 ・データの整合性規則 […]

第1章 Oracleデータベース管理の概要

リレーショナルデータベースの概要と使用する基本用語、リレーショナルデータベースにアクセスする際に使用するSQL文の概要を解説する。 Key Word ・リレーショナルデータベース ・表 ・NULL値 ・主キー ・外部キー […]

次元削減

次元削減は、教師なし学習の代表例の一つ。 次元削減は、多次元の特徴を、できるだけ元の情報を保持したまま低次元の特徴に落とすもので、得られた特徴は元の特徴とは異なる。 人間が可視化しやすいように多次元のデータ圧縮をした場合 […]

エルボー法

(5)エルボー法 k-maens法において、クラスタの数(いくつグルーピングするか)を自分で指定する必要がある。 各クラスタにはそれぞれ1つ以上のデータアリが前提である。 クラスタ数が不適切であれば、うまくグルーピングが […]

評価と類似度

(4)評価と類似度 クラスタリングは教師なし学習であるため、性能の評価が難しい。 うまくグルーピングできているかどうかを推し量るのが、類似度である。 特徴量の類似度に基づいてデータをグルーピングするのがクラスタリングであ […]

k-means法(k平均法)

(2)k-means法(k平均法) クラスタを認識させるためにアルゴリズムが必要になる。 クラスタリングには、似ている組み合わせを順番にまとめていく階層的クラスタリングや、指定した距離内の密度が最大化するようにクラスタ数 […]

クラスタリング

クラスタリングを行う主な目的は、データを自然なグループにまとめる(グルーピングする)ことである。 例えば、点在する点も大まかにいくつかのグループに括ることができる。 データの集まりをクラスタと呼ぶ。 クラスタを機械に認識 […]

教師なし学習

教師なし学習 教師なし学習は、正解データが得られない機械学習の手法である。 教師なし学習の中で、よく使われるのは、クラスタリングと次元削減である。 クラスタリングは、グルーピングのこと。 グルーピングにおけるグループ数指 […]

ディープラーニング

(7)ディープラーニング 中間層(隠れ層)を2層以上持つニューラルネットワークのことをディープニューラルネットワークと言う。 ディープニューラルネットワークを用いて行う学習が、ディープラーニング(深層学習)である。 中間 […]

誤差逆伝播法(バックプロパゲーション)

誤差逆伝播法(バックプロパゲーション)は、ランダムに定めた重みの初期値を用いてネットワークの順方向(入力側から出力側への方向)に計算を行い、その出力値と正解ラベルの誤差(コスト)をベースにネットワークの逆方向(出力側から […]

ニューラルネットワーク

(6)ニューラルネットワーク ニューラルネットワークは、多層パーセプトロンとも呼ばれている。 パーセプトロンを階層上にした構造となっている。 すなわち、線形回帰またはロジスティック回帰における入力層と出力層の間に、中間層 […]

k近傍法(k-NN) 分類法

(4)k近傍法(k-NN) k近傍法は、最も単純なアルゴリズムの一つ。特徴空間内で、分類対象のデータから距離的に近い(=類似している)k個の教師データの多数決によって、分類結果を決める手法。 k近傍法を採用する際は、kを […]

ランダムフォレスト 分類法

(3)ランダムフォレスト ランダムフォレストは、決定木の簡易版を複数作り、その多数決によって分類の結果を決める手法。 ランダムフォレストのように複数の簡易分類器の学習結果を組み合わせる手法を、アンサンブル学習という。 決 […]

決定木 分類法

(2)決定木 決定木は、説明変数に着目して、ifによる分岐を連続させ、それぞれの閾値を境にデータを分割することで、データを分類する。 メリットは、一つ一つの説明変数が結果に対して、どの程度影響を与えているかがわかりやすく […]

様々な分類手法 線形SVM・非線形SVM

(1)SVM(サポートベクターマシン) ①線形SVM SVMはロジスティック回帰と同じく、データの境界線を見つけて、データの分類を行う手法です。 超平面(クラスの境界線)から、各クラスの超平面に最も近いデータ(サポートベ […]

混同行列(Confusion Matrix)

(4)混同行列(Confusion Matrix) 混同行列とは、適合率と再現率の計算に必要な「モデルが分類した結果」と「実際の結果」を2軸として、該当する値を表にまとめたもののこと。 真陽性、偽陰性の1文字目の真偽は、 […]

分類モデルの評価

分類モデルの評価 (1)正解率(Accuracy) 最もシンプルな評価基準は、正解率(Accuracy)である。 正解率=正解した数(分子)/予測したデータ数(分母) 正解しやすいが、データに偏りがある場合は、この指標だ […]

ロジスティック回帰

ロジスティック回帰は、分類の代表的なアルゴリズムです。 パーセプトロンと同様に、線形分離可能なデータを分類するアルゴリズムである。 パーセプトロンとの違いは、 1.出力に加え、各データがあるクラスに分類される確率値を算出 […]

パーセプトロン

(1)パーセプトロンの仕組み パーセプトロンとは、複数の値を入力として受け取り、一つの値を出力するアルゴリズムのこと。 単純パーセプトロン 単層パーセプトロン このパーセプトロンという仕組は、1959年代にニューロン(神 […]

教師あり学習②(分類)

教師あり学習②(分類) 画像認識は、ここに分類される。 ロジスティック回帰 様々な分類の手法 ディープラーニング 分類の問題は大きく2つに分けられる。 二項分類(2クラス分類) 多項分類(多クラス分類) 二項分類とは、分 […]

標準化と正規化

(1)標準化 標準化とは、対象となる特徴量の分布が平均0・標準編差1の正規分布となるようにスケーリングすること。 μはデータセットの平均、データセットの標準偏差 (2)正規化 正規化とは、対象となる特徴量の最小値が0、最 […]

スケーリング

スケーリングとは、特徴量の尺度を揃えること。 各特徴量をスケーリングして、尺度を揃えることで、それぞれの係数の大小を比較できるようになる。 機械学習のアルゴリズムには、特徴量の尺度が揃っていなければ上手く動かないものがあ […]

汎化・高バリアンス・高バイアス

未知のデータに対しても、学習データと同じように精度が出るモデルのことを、汎化(Generalization)能力が高いモデルと言う。 過学習になりやすい複雑なモデルを高バリアンス(High Variance) 未学習にな […]

過学習と未学習

学習データを用いた場合には、高い精度が出るのに、未知のデータでは精度が出ない状態を過学習(Overfitting)と言う。 過学習は、学習データに対して、過度に適合した結果である。 練習問題は合格点だが、実際のテストでは […]

多項式

モデル精度の改善方法 1.トレーニングデータを増やす 2.説明変数を増やす/減らす 3.新しい特徴量を作成する 4.多項式項目を増やす 5.正則化を取り入れる(増減):本講座では扱わない。 多項式項目とは、多項式項目を取 […]

決定係数

平均二乗誤差以外にも回帰式の精度を表す指標はある。その一つが決定係数である。 決定係数は、回帰分析の当てはまりの良さを表し、データの変動を回帰式で説明できる割合のこと。 決定係数の範囲:0~1 全てのデータが回帰式上にあ […]