statepipyの日記

興味のある分野(統計、疫学、機械学習、品質管理、手料理)と、PCスキルの維持を目的に書き続けます!

Pandasコマンド

# count, mean, std, min, 25%タイル値, 50%タイル値, 75%タイル値, max の確認
df.describe()
# 外れ値の確認
data["●●●"].value_counts().sort_index().tail()
data["●●●"].value_counts().sort_index().head()
# 特定のデータの削除  (連続変数である[y]の20以上を残す場合)
data = data[data['y'] >= 20]     *二重[[ ]] となっていることに注意。