Converting multiple related rows in a dataframe to a single row for Machine learning – StackOverflow

謎だ.

最初のデータ構造であれば,特徴量が2つで3patternの分類問題として,

import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report

dfRaw = pd.DataFrame([[1, 2, 3], [1, 4, 6], [1, 3, 6], [2, 38, 80], [2, 45, 66], [3, 100, 120],[3, 90, 110], [3, 115, 125], [3, 99, 101]], columns=['Sample', 'A1', 'A2'])

clf = RandomForestClassifier()
clf.fit(dfRaw.loc[:, 'A1':'A2'], dfRaw['Sample'])
pred_train = clf.predict(dfRaw.loc[:, 'A1':'A2'])
print(classification_report(dfRaw['Sample'], pred_train))
         precision    recall  f1-score   support

      1       1.00      1.00      1.00         3
      2       1.00      1.00      1.00         2
      3       1.00      1.00      1.00         4

avg / total 1.00 1.00 1.00 9

これ,結構綺麗なデータで,

import numpy as np

np.dot(dfRaw.loc[:, 'A1':'A2'].values, clf.feature_importances_)
#A1 * 0.31229933 + B2 * 0.68770067

array([ 2.68770067, 5.37540134, 5.06310201, 66.88342809,
59.44171405, 113.75401338, 103.75401338, 121.87700669,
100.37540134])

なんで,変換するのか.質問1は寧ろそれを明確にしなければ意図が分からない.

それとも,単にPandas.DataFrameの操作の話なんだろうか.

広告
カテゴリー: 未分類 パーマリンク

への1件のフィードバック

  1. ピンバック: shapeに注意 | 粉末@それは風のように (日記)

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中