Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

English us

DATAmaestro is a cloud-based application, which makes getting started faster and easier. Its intuitive design provides a comfortable learning environment. The following sections describe how to navigate and use the work area.

  • Change password
  • User Settings
  • DATAmaestro Analytics Menu and Sidebar
  • DATAmaestro Analytics Display Options
  • User Guide Conventions

For more information, see FAQ.

Change password

We recommend changing your password at the first connection and then on a regular basis. 

  1. Open the user menu in the top right corner
  2. Click Change password.
  3. Enter your existing password, then enter your new password twice. You must use a combination of characters (min 8 characters using upper/lower/numbers). 
  4. Click Change password to confirm

For DATAmaestro deployments with a separate server for DATAmaestro Lake from Analytics+Dashboards, you must do this on the DATAmaestro Lake server

User Settings

Your user privileges in DATAmaestro determine what you can customize in your work environment.

Info
titleMultilingual DATAmaestro

To help users around the globe, we are progressively rolling out multilingual DATAmaestro.

A first beta-version is ready in French and Japanese.

Under the user menu, select “Language” to set your preference.

DATAmaestro Analytics Menu and Sidebar

In DATAmaestro Analytics, the main features are organized in a project workflow in the top menu. To access your saved project tasks, open the sidebar on the left.

The Analytics Menu

Items in the menu bar help you manage your projects through every stage.  

Menu ItemDescription
ProjectCreate, open, delete or copy a project. You can also set preferences to customize the page appearance.
Data

Manage the data sources that support your projects. You can upload CSV or Excel files, or use data connections like AllegroGraph or DATAserver.

Tip
titleExcel plugin

To upload Excel files you must install a plugin, contact Technical Support.


Select

Create a new Record set or Variable set. For more information, see Data.

TransformUse operators to create or edit Function Variables expressions, as well as process control features including CUSUM, Statistical Process Control (SPC), and Principal Component Analysis (PCA).
VisualizeCreate histograms, scatter plots, box plots, trends and dendrograms based on data you select.
Models Use learning and test sets to build automatic learning models. Train your data using robust classification, regression and clustering techniques.
Reports Export subsets of your data to use for reporting purposes outside of DATAmaestro.
HelpFind answers to questions in the collection of user references and tutorials.
User MenuSwitch between Lake, Analytics or Dashboards, Change password, change Language preferences, and more. 

The Analytics Sidebar

In DATAmaestro Analytics, use the sidebar to access the elements that have been saved in your project. Elements are saved with their associated feature, which is represented by a grey icon. Hold your mouse pointer over an icon to see the name of the feature and the number of elements that are saved. For example, histograms: 

IconActiveDescription

 

The current project has nine saved histograms.


To expand and collapse all tasks using the sidebar, click All at the top of the sidebar. The expanded panel displays all the saved elements for each feature.

Expanded Sidebar PanelSidebar Controls 

 

Search: Use the search field at the top to find saved elements.

Pin: To pin the sidebar panel and view all of the current page, click (). 

Open: To open an element, click the name in the sidebar.

New: To create a new element, click Add new... in the appropriate section.

Manage: To edit () or delete () elements, click the appropriate icon.  

Tip
titleDeleting and data dependency
If the element you want to delete is used by another task, the title of the task is displayed in the dialog box for you to confirm. If you delete the element, the depending tasks are also removed. For example, if you confirm and delete a function variable that is used for a histogram, a scatter plot and a decision tree, they will all be removed.


 Sidebar Icons

IconNameDescription
Data sourcesData source(s) uploaded to support the project. The number of files is indicated on the active icon.
Variable setsVariable sets that have been created for the project. By default, all the individual variables appear in the Variable List.
Record setsRecord sets are created to establish specific record groups for a given data source. For example, records that correspond to a production regime, records associated with the normal variation range of a KPI variable.
Function variablesFunction variables are created to transform variables for models and advanced analysis.
HistogramsHistograms are typically used to illustrate the process distribution and are used to make predictions about a stable process.
Scatter plots

Scatter plots are typically used to show how much one variable is affected by another. Each row in the data table is represented by a marker whose position depends on its values in the columns set on the X- and Y-axes.

Box plots Box plots provide effective views to help identify outliers. They show a data set’s lowest value, highest value, median value, and the size of the first and third quartiles. The box plot is useful in analyzing small data sets that do not lend themselves easily to histograms.
Trends Curves are typically used to compare the temporal dynamic behaviour/trend of two or more numerical variables of a database. 
DendrogramsDendrograms and Correlation matrices provide a means of assessing dependency levels between variables. A dendrogram is a tree-structured graph used in heat maps to visualize the result of a hierarchical clustering calculation.
Linear regressions A simple linear regression is an approach to modeling the relationship between a scalar dependent variable Y and one explanatory variable denoted X. Several input variables may be combined to predict an output variable Y in the shape of a multi-linear regression.
Trees Decision trees and Regression trees in are important modeling methods that are used to accomplish a prediction objective (classification or regression).
Ensemble trees 

Ensemble trees are an extension of the regular tree methods; Extra Trees, Adaboost & MART.

Clustering K-Means and Subclu models in the project. 

Other tasksAll other items can be found under the Other menu, including models: Artificial Neural Networks, Partial Least Squares, k-Nearest Neighbors, Partial Dependence Plots, Sensitivity Analysis, Dynamic Inputs, PRIM analysis & Optimizer, Statistical tests: T test, Spearman and Pearson, as well as, Data Exports, Summary Charts, Process Flow and more. 

DATAmaestro Analytics Display Options

The colour pallet, fonts and other display options can be modified to suit your preference. To change the display settings and work environment in an Analytics project:

  1. Click Project > Preferences in the menu.
  2. Click Add Entry and then enter a Symbol and Color.
  3. Click Save, or on icon  to delete a preference.

User Guide Conventions

The conventions used in this document are described below. 

ElementExampleDescription
Bold textClick Compute to see the revised calculation.A clickable item or button.
Lesson highlight


Info
titleLesson

To use the data from ...


Lessons and additional information to enhance your learning.
Note highlight 


Tip
titleTip

To find an variable, use the search field.


Notes and tips to speed your process provide alternative methods.
Screen captures 
 

Example screen captures used in this document are from the Home Energy tutorial.


Info
titleDownload Cheat Sheet

View file
nameCS_Mod 4_Section 2_Activity 1_get started with DATAmaestro -JV.pdf
height250



Japanese

作業領域


DATAmaestro はクラウドベースのアプリケーションであり、すばやく簡単に始めることができます。直感的な設計のため、快適な環境で学習できます。次のセクションでは、操作方法と作業領域の使用方法について説明します。

詳細については、FAQを参照してください。

メニューとサイドバー

主な機能は上部メニューのプロジェクトワークフローに整理されています。保存されたプロジェクト情報を表示するには、左側のサイドバーを開きます。

メニュー

メニューバーの項目を使用すると、すべてのステージでプロジェクトを管理できます。  

メニュー項目

説明

プロジェクト

プロジェクトを作成、開く、削除、またはコピーします。パラメーターを設定して、ページの表示をカスタマイズすることもできます。

データ

プロジェクトをサポートするデータソースを管理します。CSV または Excel ファイルをアップロードするか、AllegroGraph や DATAserver などのデータ接続を使用できます。

Excel プラグイン

Excel ファイルをアップロードするには、プラグインをインストールする必要があります。テクニカルサポートまでお問い合わせください。

選択

新しいオブジェクトセットまたは属性セットを作成します。詳細については、データを参照してください。

変換

演算子を使用して、関数属性式や、CUSUM、統計的工程管理 (SPC)、主成分分析 (PCA) などのプロセス制御機能を作成または編集します。

視覚化

選択したデータに基づいて、ヒストグラム、散布図、箱ひげ図、曲線、樹形図を作成します。

モデル 

学習セットとテストセットを使用して、自動学習モデルを構築します。ロバスト分類、回帰、クラスタリング手法を使用してデータを学習します。

レポート 

データのサブセットをエクスポートして、DATAmaestro 外部に報告する目的で使用します。

ヘルプ

ユーザーリファレンスとチュートリアル集で質問に対する答えを検索します。

サイドバー

サイドバーを使用して、プロジェクト用に保存された要素にアクセスします。要素は関連付けられた機能 (灰色のアイコン) とともに保存されます。アイコンにマウスカーソルを置くと、機能の名前と保存された要素数が表示されます。たとえば、ヒストグラムでは次のようになります。 

アイコン

アクティブ

説明

 

現在のプロジェクトには 9 個のヒストグラムが保存されています。


サイドバーを展開したり折りたたんだりするには、サイドバー上部の [すべて] をクリックします。展開されたパネルには、各機能のすべての保存された要素が表示されます。

展開されたサイドバーパネル

サイドバーコントロール 

 

検索: 上部にある検索フィールドを使用して、保存された要素を検索します。

固定: サイドバーパネルを固定して、現在のページをすべて表示するには、() をクリックします。 

開く: 要素を開くには、サイドバーで名前をクリックします。

新規: 新しい要素を作成するには、該当するセクションで [新規追加...] をクリックします。

管理: 要素を編集 () または削除 () するには、該当するアイコンをクリックします。  

削除とデータ依存関係

削除する要素が視覚化で使用されている場合は、確認のため、グラフのタイトルがダイアログボックスに表示されます。要素を削除する場合、視覚化も削除されます。たとえば、ヒストグラム、散布図、決定木で使用される関数属性を確認して削除する場合、視覚化もすべて削除されます。 

 サイドバーアイコン

アイコン

名前

説明

データソース

プロジェクトをサポートするためにアップロードされるデータソース。ファイル数はアクティブアイコンに表示されます。

属性セット

プロジェクトに作成された属性セット。既定では、すべての個別の属性が属性リストに表示されます。

オブジェクトセット

オブジェクトセットは、特定のデータソースの特定のオブジェクトグループを作るために作成されます。たとえば、プロダクションレジームに対応するオブジェクト、KPI 属性の正常変動範囲に関連付けられたオブジェクトなどがあります。

関数属性

関数属性はモデルと高度な分析の変数を変換するために作成されます。

ヒストグラム

一般的に、ヒストグラムはプロセス分布を図で示し、安定したプロセスに関する予測を行うために使用されます。

散布図

一般的に、散布図は 1 つの変数がどの程度別の変数の影響を受けるのかを示すために使用されます。データ表の各行はマーカーで表現されます。マーカーの位置は、X 軸と Y 軸で設定された列の値によって異なります。

箱ひげ図 

箱ひげ図は異常値を特定のに効果的な図です。データセットの最低値と最高値、中央値、第 1 四分位、第 3 四分位が表示されます。箱ひげ図は、ヒストグラムには適していない小さいデータセットの分析で効果的です。

曲線 

一般的に、曲線はデータベースの 2 つ以上の数値変数の時間動的動作/傾向を比較するために使用されます。X 軸は時間関連の変数でなければなりません。

樹形図

樹形図と相関行列では、変数間の依存度を評価できます。樹形図はヒートマップで使用されるツリー構造のグラフで、階層クラスタリング計算の結果を視覚化します。

線形回帰 

単回帰分析はスカラー依存変数 Y と 1 つの説明変数 X の間の関係をモデリングする方法です。複数の入力変数を結合して、重回帰分析の形態で出力変数 Y を予測できます。

木 

決定木と回帰木は、予測目標 (分類または回帰) を達成するために使用される重要なモデリング方法です。

アンサンブル回帰木 

アンサンブル回帰木は標準の木 (決定木と回帰木) の延長です。

クラスタリング 

プロジェクトの K平均法と Subclu モデル。 

重要度変数 

現在サポートされている統計的仮説検定は次のとおりです。T 検定、スピアマン、ピアソンプロジェクトの回帰分析と PRIM 分析モデル。 

命名規約

本書で使用される命名規約は次のとおりです。  

要素

説明

太字の文字

[算出] をクリックすると、変更された計算が表示されます。

クリック可能な項目またはボタン。

コースのハイライト

コース

データを使用する方法:

学習効果を高めるためのコースや詳細情報。

ハイライト 

ヒント

属性を検索するには、検索フィールドを使用してください。

手順をスピードアップするための注記やヒントでは別の方法を提案しています。

画面キャプチャ 

 

本書で使用されている画面キャプチャの例は、「家庭用エネルギーチュートリアル」から利用しています。

ユーザー設定

DATAmaestro のユーザー権限によって、作業環境でカスタマイズ可能な項目が決まります。

表示オプション

カラーパレット、フォント、その他の表示オプションは、お好みに合わせて変更できます。表示設定と作業環境を変更する

  1. メニューで [プロジェクト] > [設定] をクリックします。
  2. [エントリの追加] をクリックしてから、記号と色を入力します。
  3. [保存] をクリックするか、アイコン   をクリックして設定を削除します。