Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

English us

For more information, see the online learning platform

A histogram is a frequency diagram and statistical tool that performs non-parametric density estimation.

To launch the histogram editor, select Visualize > Histogram from the menu. Alternatively, click the icon () in the sidebar and then add New

Create a Histogram

The parameters for a histogram are defined on two tabs at the top of the page: Data and Properties.

On the Properties tab: 

  1. Select a Record set from the list.
  2. Select from the Variable list and set an variable for X, and one for C (Condition), if required.
Tip
titleFind a Variable

Variables are listed alphabetically. To find a variable, enter a name in the Variable field.

On the Advanced tab:

  1. Enter a chart Title
  2. Enter Font Size of the graphic, if required. 
  3. Select Show statistics to display standard deviations and average values. A bell curve displays corresponding to the theoretical normal (Gaussian) distribution using the mean (average) and standard deviation of the selected record set.
  4. Select Legend position, the Default position is on the left-corner of the graph. You can also have the option of have no legend (None). 
  5. Select Conditional class count for the condition or number of discretized groups for a conditional variable added as color coding to Histograms. For more information, see Conditional class count
  6. Select a Plot Type for the drop down list: 
    1. Histogram is a graphical representation of a numerical data distribution. For a numerical variable, the data is divided into consecutive and non-overlapping adjacent intervals, often of equal sizes. The height of each bar is proportional to the frequency – number of cases per interval. For symbolic variables, the intervals represent the classes (categories) of that variable.
    2. Pareto is a bar graph for symbolic variables only, where the symbols are represented in descending order. The lengths of the bars represent the frequency of occurrence of the set of categories of a symbolic variable. The purpose of this chart is to highlight the most important among a large set of categories.
    3. Cumulative plot is a curve that shows the cumulative frequency distribution.
  7. Select the check box for Relative frequencies to display the Y axis as a percentage (number of records in a bar / total number of records in the set). See glossary Relative Frequencies
  8. Define zoom area using X axis, Y axis and Y' axisSelect a date in the calendar in X axisEnter the values of Y and Y'axis
  9. Click Save to load the data.
Tip
titleChange number buckets

To change the number of buckets for the Condition, use Cond. Class Count.


Tip
titleChoose color for condition variable

If you want to define a color to a symbolic variable used as a Condition, use the Preferences task.

Control the View

Use the control menu below the chart to modify the zoom, apply rulers to create new record sets. For more information, see Control Menu

Info
titleCopy/Save Histogram

To copy or save the curve click on the curve with the right click and select Copy image or Save image as

Example Visualization

The following example illustrates the seasonal daytime weekly averages of electrical consumption.



Tip

View X values and bucket sizes for histograms on trolley bar. 





Japanese

ヒストグラム


ヒストグラム

ヒストグラムは度数図です。また、パラメトリック密度推定を実行する統計ツールです。

ヒストグラムエディターを起動するには、メニューから [視覚化] > [ヒストグラム] を選択します。あるいは、サイドバーのアイコン () をクリックして、[新規] をクリックします。 

ヒストグラムの作成

ヒストグラムのパラメーターは、ページの上部にある[データ] および [プロパティ] という 2 つのタブで定義されます。

[プロパティ] タブ: 

  1. リストからオブジェクトセットを選択します。
  2. [属性] リストから選択し、X の属性と、必要に応じて C (Condition) の属性を選択します。

属性の検索

属性はアルファベット順に一覧表示されます。属性を検索するには、[属性] フィールドに名前を入力します。

[詳細] タブ:

  1. グラフのタイトルを入力します。 
  2. 必要に応じて、グラフィックのフォントサイズを入力します。 
  3. [統計情報を表示] を選択すると、標準偏差と平均値が表示されます。表示される正規分布曲線は、理論的な正規分布 (ガウス) に対応し、選択したオブジェクトセットの平均と標準偏差を使用します。
  4. [凡例の位置] を選択します。既定の位置はグラフの左端です。凡例を表示しない (なし) こともできます。 
  5. 色分けとしてヒストグラムに追加された条件属性の離散グループの条件または数の条件クラス数を選択します。詳細については、条件クラス数を参照してください。 
  6. ドロップダウンリストでプロットタイプを選択します。  
    1. ヒストグラムは数値データの分散をグラフィカルに表現します。数値属性の場合、データは連続し、重複しない隣接する (通常は同じサイズの) 間隔に分割されます。各棒の高さは頻度 (間隔ごとのクラス数) に比例します。記号属性の場合、間隔はその属性のクラス (カテゴリ) を表します。
    2. パレート図は記号属性のみの棒グラフです。記号が降順に表されます。棒の長さは記号変数のカテゴリのセットの発生頻度を表します。このグラフの目的は、大きいカテゴリセットで最も重要な要素をハイライトすることです。
    3. 累積プロットは累積度数分布を示す曲線です。
  7. [相対度数] チェックボックスをオンにすると、Y 軸が割合 (棒のオブジェクト数 / セットの合計オブジェクト数) として表示されます。用語集相対度数を参照してください。 
  8. X 軸Y 軸Y' 軸を使用してズーム領域を定義します。X 軸でカレンダーの日付を選択します。Y および Y' 軸の値を入力します。 
  9. [保存] をクリックしてデータを読み込みます。

バケット数を変更する

条件のバケット数を変更するには、条件クラス数を使用します。

条件属性の色を選択する

条件として使用される記号属性の色を定義する場合は、[設定] タスクを開きます。 

ビューの制御=

ズーム倍率を変更するには、グラフの下のコントロールメニューを使用します。新しいオブジェクトセットを作成するには、ルーラーを適用します。詳細については、制御メニューを参照してください。 

ヒストグラムのコピー/保存

曲線をコピーまたは保存するには、曲線を右クリックして、[画像のコピー] または [名前を付けて画像を保存] を選択します。 

視覚化の例

次の例は、季節ごとの日中の週間平均電力消費量の図を示します。