かれ4

かれこれ4個目のブログ

Azure Machine Learningで入力されたデータに行番号をつける

データに行番号をつける理由

分類器を造っているときに、もしかしたら、復数のアルゴリズムを同時につかい、 各アルゴリズムの結果を元に、最終の分類をしたい事があるかもしれない。

f:id:tottokug:20170829231950p:plain

こんな感じで簡易マギシステムが出来上がるわけです。

行番号をつける方法

そもそもAzure Machine Learningに持ってくる前に付与しておけば良いという話ではあるんだけれども、、、 とりあえず、Azure Machine Learningには、便利なモジュール Apply SQL Transformation がある。 このモジュールを使えば簡単に出来る。

f:id:tottokug:20170829231356p:plain

まずは行番号を付けたいデータをApply SQL Transformationに入力します。 モジュールの中身のSQL Query Scriptは以下のようにします。

select 
ROWID as rowid, 
* from t1;

こんな感じ。

これでApply SQL Transformationの出力には今まであったカラムにrowidと言うカラムが追加されて出力されます。

便利。

Apply SQL Transformationとは

Azure Machine Learningの中でもPython,Rと同様にSQLで記述することで、データの加工が出来るモジュール。

データを最大3つまで入力することができ、SQLでJOINしたり値を整形したりすることができる。

SyntaxはSQLiteなので、今回のようなROWIDという隠れカラムも使用することが可能。