UCLA の Generalized linear Regression Models セミナーに参加しました。

R 統計学

日本時間の朝５時からでしたら、参加してみました。 ↓ は講師の先生が使用したスライドです。また参加します！stats.idre.ucla.edu

#UCLA

2021-08-30

寄与度・寄与率

統計検定統計学オープンデータ

「寄与度」の計算方法です。先ずは、「寄与率」との違いを認識する必要があります。 www.meti.go.jp

#統計 #オープンデータ

2021-08-30

経済産業省　経済分析室

オープンデータ統計学

www.meti.go.jp

#統計 #オープンデータ

2021-08-30

業務量調査の方法

Kaizen 品質管理改善

現場の業務量調査は、業務量の把握や改善、適正人員配置等で行われますが、容易なことではありません。少し調べてみましたので、まとめてみました。実際の業務量の測定には、以下ような手法があります。www.bpm-portal.jp www.newspt.co.jp ① 稼働分析法・…

#品質管理 #改善

2021-08-30

相関係数を求める際のサンプルサイズ

統計学データサイエンス

相関係数はサンプルサイズは大きくなると、r＝0.2程度の相関であっても有意となってしまいます。相関係数を検討する際においても、サンプルサイズの計算が提唱されています。計算式等は以下の書籍に記載されていますが、想定される相関係数によって以下の…

#統計学

2021-08-30

データサイエンス基礎（統計検定）を受験しました！

統計学統計検定

公式HPにあるサンプルを過信し、当日に臨みました（ほとんど、ぶっつけ状態ですが・・・）テストは、2021年7月版の問題でした。試験内容ですが、大問題が８つあり、各大問には小問題が５問程度あります。８個の大問の中で、実際にエクセルを動かして計算す…

#統計検定

2021-08-27

文字変数のコード化

python

# 「t」または「f」が入力ｓれているので、「t」なら1、「f」ならを返す関数を作成 def trans_f(x): if x == 't': return 1 elif x == 'f': return 0 # apply関数を用いて変換 data['文字変数A'] = data['文字変数A'].apply(trans_f(x)) # 無名関数の記述 da…

#Python

2021-08-27

特徴量選択

データサイエンス

特徴量の選択には、以下の３つが知られている。フィルター法ラッパー法組み込み法

#データサイエンス

2021-08-26

内閣府データ分析セミナー

オープンデータ

内閣府データ分析セミナー www.chisou.go.jp

#オープンデータ

2021-08-26

地域経済循環分析

オープンデータ

環境省地域経済循環分析 www.env.go.jp

#オープンデータ

2021-08-26

重複のセルにマークをつける

Excel

Excelに入力したリスト等のデータにおいて、効率的に重複の箇所を見つける場合、「countif関数」が有効です。関数の第1引数には範囲を、第2引数には重複を探すセルを選択しますが、第1引数を絶対参照(F4)にしておかなければ、検索範囲がズレてしまいます。

#Excel

2021-08-26

散布図の描画

python

# 散布図 data.plot.scatter(x='X軸の変数名', y='Y軸の変数名') plt.show()

#Python

2021-08-26

相関係数を求める際に必要なサンプルサイズ

統計学

後ほど、書きます！

#統計

2021-08-26

ノンパラメトリックの多重比較（stata）

統計学 stata

dunn検定と Conover-Iman検定がユーザによって公開されているので、下記のようにインストールを行う。 ■ ssc install dunntest ■ ssc install conovertest詳細については、help dunntest 及び help conovertest で確認する。

#統計 #Stata

2021-08-26

■

python

# seabornのインポート import seaborn as sns # X軸及びY軸の指定 sns.boxplot(data=●●●●, x="X軸に相当する変数名", y="Y軸に相当する変数名") # 可視化結果を表示 plt.show() # 表示範囲を制限する時（例では0～500） plt.ylim(0, 500) #←このコマンドが…

#Python

2021-08-26

今度挑戦します！（とろ～りチーズのハムカツ）

手料理

oceans-nadia.com

#料理#お手軽

2021-08-25

Pandasコマンド

python

# count, mean, std, min, 25%タイル値, 50%タイル値, 75%タイル値, max の確認 df.describe() # 外れ値の確認 data["●●●"].value_counts().sort_index().tail() data["●●●"].value_counts().sort_index().head() # 特定のデータの削除 (連続変数である[y]の…

#Python

2021-08-24

人はなぜミスをしてしまうのか

品質管理 TQM

www.igaku-shoin.co.jp

#品質管理

2021-08-22

axis=0 と axis=1 (Pandas)

python

axis=0 → 列単位 axis=1 → 行単位 #1列目を削除 df1 = df.drop(0, axis=0) #1行目を削除 df1 = df.drop(0, axis=1)

#Python

2021-08-22

QC活動と単なる改善（Kaizen）の違い

TQM Kaizen 品質管理

以下のようなことを耳にすることがある。「行いたいこと（＝対策）はだいたい決まっているのに、何故、QC活動を行わないといけないのか？」「改善活動とQC活動（TQM）との違いは？」「QCとTQMとは、何が違うのか？」以下に、筆者としての見解を述べたいと…

#TQM #医療 #改善 #KAIZEN #品質管理

2021-08-22

Googleドライブのマウント

python

# マウント from google.colab import drive drive.mount('/content/drive') 上記コマンドを入力後、Googleにアクセスする際のパスワードを貼り付けて完了！その他にも、以下のようなものがある。 # ドライブ内のファイルをリスティング（中身の確認） ! ls…

#Python

2021-08-22

リストとリスト内包表記

python

リスト内包表記を用いれば、シンプルな記載となり、行数も削減できる！ # リスト list = [] #空のリスト作成 for i in range(10): list.append(i) #appendで空のリストに追加 print(list) # リスト内包表記 list = [i for i in range(10)] print(list) 何れ…

#Python

2021-08-21

定年後のお仕事

働き方

今は一つの企業で勤めるのはリスクと言われる時代。自己をSWOT分析し、実践してみたいです。 toyokeizai.net

#定年後

2021-08-20

データの記述_pandas

python

# 連続データの記述(count,mean, std, min, 25%, 50%, 75%, max ) df.describe() # データの性状を問わず、全てのデータの記述 df.describe(include="all") # locを用いた、特定のデータの記述 (例は「平均」) df.describe().loc["mean"]

#Python

2021-08-20

データの抽出_pandas

python

読み込んだからのデータ抽出 #特定の用語(●●●●●●)を含むデータの抽出 df[df["主病名"].str.contains("●●●●●●")] #特定の用語(●●●●●●)を含まないデータの抽出 df[~df["主病名"].str.contains("●●●●●●")] # 複数条件を含む用語の抽出 df[(df["年齢"] >=65) & (…

#Python