statepipyの日記

興味のある分野(統計、疫学、機械学習、品質管理、手料理)と、PCスキルの維持を目的に書き続けます!

2021-08-20から1日間の記事一覧

データの記述_pandas

# 連続データの記述(count,mean, std, min, 25%, 50%, 75%, max ) df.describe() # データの性状を問わず、全てのデータの記述 df.describe(include="all") # locを用いた、特定のデータの記述 (例は「平均」) df.describe().loc["mean"]

データの抽出_pandas

読み込んだからのデータ抽出 #特定の用語(●●●●●●)を含むデータの抽出 df[df["主病名"].str.contains("●●●●●●")] #特定の用語(●●●●●●)を含まないデータの抽出 df[~df["主病名"].str.contains("●●●●●●")] # 複数条件を含む用語の抽出 df[(df["年齢"] >=65) & (…