Pandasコマンド
# count, mean, std, min, 25%タイル値, 50%タイル値, 75%タイル値, max の確認
df.describe()
# 外れ値の確認 data["●●●"].value_counts().sort_index().tail() data["●●●"].value_counts().sort_index().head()
# 特定のデータの削除 (連続変数である[y]の20以上を残す場合) data = data[data['y'] >= 20] *二重[[ ]] となっていることに注意。