mikutaifukuの雑記帳

個人的な雑記帳。データ分析とか読んだ本の感想とか。

臨床予測モデルの開発に必要なサンプルサイズの算出(Calculating the sample size required for developing a clinical prediction model)

概要 ヘルスケア領域のデータ分析に携わっていると、よく質問されるのが 「どれくらいサンプルサイズが必要なの?」 という質問です。統計的仮説検定であれば、 「有意水準、検出力…等を指定して、必要サンプル数を求めることが可能だと思います」 とそれら…

MENTA登録してみました

知り合いが登録しているとのことで、チャレンジしてみることにしました。 【初心者〜中級者向け】R/Pythonでのデータ分析スキル習得に向けてサポートします! mikutaifuku|メンターに教えてもらおう こういうのをきっかけに、ちょっとした弱い繋がりができ…

ggplot2でfacetごとのヒストグラムに色んな情報を付与する② 〜Tidy evalによる関数化と繰り返し処理〜

概要 前回の続きで、自分用メモです。 mikutaifuku.hatenablog.com タイトルの通り、Tidy evalにより関数を作り*1、全ての変数に対して処理を繰り返し行います。 要は、以下のようなグラフを Sepal.Width, Petal.Length, Petal.Width 全てに対して作ります。…

ggplot2でfacetごとのヒストグラムに色んな情報を付与する① 〜基本作図編〜

概要 大した内容ではないですが、仕事で使ったので自分用メモです。なので、やや適当です。 以下のようなグラフを作ります。 具体的には、以下のような特徴を備えたグラフです。 facetごとのヒストグラムに、要約統計量(平均値、最小値、最大値)の線を引く…

Fitbitデータでスパース推定に入門してみる④ 〜Graphical lassoで変数間の関係性について調べる〜

はじめに これまで述べてきたのは、主にモデルの回帰係数の推定に基づく話でした。 mikutaifuku.hatenablog.com mikutaifuku.hatenablog.com mikutaifuku.hatenablog.com 今回のエントリでは、これまでの回帰係数の推定ではなく、共分散構造に注目した手法を…

Fitbitデータでスパース推定に入門してみる③ 〜心拍数データに対してfused lassoを使い、変化点を検出する〜

はじめに 前回の記事では、個々の変数を選択するための様々なスパース推定の手法をまとめ、Fitbitデータに適用することでそれぞれの手法を比較しました。 mikutaifuku.hatenablog.com 今回のエントリでは、少し趣向を変えて心拍数データに対して、fused lass…

Fitbitデータでスパース推定に入門してみる② 〜lasso, elastic net, SCAD, adaptive lassoの概要とRでの数値例〜

はじめに 前回の記事では、スパース推定の概要と代表的な手法であるlassoについてまとめ、fitbitデータに適用することで、睡眠効率に影響を与える要因を探索しました。 mikutaifuku.hatenablog.com 今回のエントリでは、lasso以外の様々なスパース正則化法を…

Fitbitデータでスパース推定に入門してみる① 〜lassoで睡眠効率に影響を与える要因を探る〜

はじめに 2018年2月22日~2月23日(2日間)、統計数理研究所の2017年度リーディングDAT講座「【L-B2】 機械学習とデータサイエンスの現代的手法」(2017年度リーディングDAT)に参加してきました。(【L-B1】 実践ベイズモデリング」は抽選に外れたので来年あ…

Fitbitデータで因果を探索してみる 〜独立成分分析によるLiNGAMモデルの推定〜

はじめに 2018/2/11に日本経済新聞電子版にて以下のような記事が掲載されました。 元論文(日本経済研究センター JCER)の総論では、「博士増、生産性向上に結びつかず」と書かれており、大学教育や企業の活かし方に問題があるのでは、と問題提起をしていま…

Fitbitの心拍数データで異常検知 〜自己回帰モデルによるアプローチ〜

概要 前回の記事に引き続き「入門 機械学習による異常検知―Rによる実践ガイド」を参考に、自分のFitbitの心拍数データを使って7章の時系列データの異常検知をやってみました。前回は特異スペクトル変換法を用いましたが、今回は自己回帰モデルを使用してや…

Fitbitの心拍数データで異常検知 〜特異スペクトル変換法による変化点検知〜

概要 前回の記事に引き続き「入門 機械学習による異常検知―Rによる実践ガイド」を参考に、自分のFitbitの心拍数データを使って7章の時系列データの異常検知をやってみました。前回は近傍法を用いましたが、今回は特異スペクトル変換法で変化点検知をやって…

Fitbitの心拍数データで異常検知 〜近傍法で異常部位検出〜

概要 「入門 機械学習による異常検知―Rによる実践ガイド」を読んで、自分でもやってみたいと思い、自分のFitbitの心拍数データを使って7章の時系列データの異常検知をやってみました。似たような記事は他にも色々あり*1、二番煎じではありますが自分なりに…