statepipyの日記

興味のある分野(統計、疫学、機械学習、品質管理、手料理)と、PCスキルの維持を目的に書き続けます!

python

リストとリスト内包表記

リスト内包表記を用いれば、シンプルな記載となり、行数も削減できる! # リスト list = [] #空のリスト作成 for i in range(10): list.append(i) #appendで空のリストに追加 print(list) # リスト内包表記 list = [i for i in range(10)] print(list) 何れ…

データの記述_pandas

# 連続データの記述(count,mean, std, min, 25%, 50%, 75%, max ) df.describe() # データの性状を問わず、全てのデータの記述 df.describe(include="all") # locを用いた、特定のデータの記述 (例は「平均」) df.describe().loc["mean"]

データの抽出_pandas

読み込んだからのデータ抽出 #特定の用語(●●●●●●)を含むデータの抽出 df[df["主病名"].str.contains("●●●●●●")] #特定の用語(●●●●●●)を含まないデータの抽出 df[~df["主病名"].str.contains("●●●●●●")] # 複数条件を含む用語の抽出 df[(df["年齢"] >=65) & (…

リスト

DataFrameから1列のデータを取り出す場合のデータはSeries型、複数の列を取り出す場合のデータ型はDataFrame型となる。 #1列の場合 df["変数1"] #2列の場合 df[["変数1", "変数2"]] 読み込んだデータから特定の行のみを位置番号を用いて、取り出したい場合は…

Pythonとネットワーク自動化検定(日本ネットワーク技術者協会)

新しい資格のようですね。 it.impress.co.jp

pythonを勉強する上で参考になるWeb site

qiita.com

CSVの読込み

CSVの読込みで、index_col=0 と指定すれば、1行目をインデックスとして扱う。 data = pd.read_csv("●●●●.csv", index_col=0) data.head() 逆に、index_col を指定しなければ、全てのCSVを読込み、勝手に行番号を発番する。 data = pd.read_csv("●●●●.csv") d…

リスト_2

リストに要素を追加する場合は、appendを用います。 point_scores = [1, 2, 3, 4] point_scores [1, 2, 3, 4] これに「5」を追加します。 point_scores.append(5) point_scores [1, 2, 3, 4, 5] 無事、出来ました!

リスト_1

リストを作成するには、リストを構成する要素をコンマ(,)で区切り、全体を角括弧[ ] で囲みます。 ここでは、九州・沖縄の8県を入力し、変数kyushuに代入します。 リストのインデックス(番地のようなもの)は 0(ゼロ) から始まります。福岡県を取り出す場合、…

欠損の処理

3つのアプローチ ~kaggleより~1) 欠損値のある列や行を削除する 最も単純な方法は、値が欠落している列や行を削除することですが、この方法では、多くの情報の欠落やバイアスを生じます。2) 代入する(Imputation) Imputationは、欠損値を何らかの数値で埋…

関数の定義・返値

・関数の定義 1行目にはコロン(:)が、2行目の始まりは空白(インデント)なので注意が必要。 def bmi(height, weight): return weight / (height/100)**2 bmi(166,63.5) ・関数の返値 23.04398316156191 良かった! BMI(体格指数)は基準内(18.5以上、25未満)…