■データ解釈学入門
garbage in garbage out ゴミを見てるとゴミしか出てこない
測定が難しい、欲しいデータが取れないことの問題
ランダム要素の和は正規分布が多い
観測のプロセスがデータに既に影響を与えている
ピークが複数ある、外れ値等で分布を見ておきたい
実数を見たら割合も見る
実数を見たら割合も見る
因果関係が特定→メカニズム理解
因果関係がある→介入で影響力出せる
相関関係がある→予測できる
目的変数または従属変数 ワインの質
説明変数または独立変数 天候温度等
両方が量的変数なら重回帰分析
目的変数がカテゴリ変数で説明変数が量的変数ならロジスティック回帰
目的変数が量的変数で説明変数がカテゴリ変数なら分散分析や多重比較分析
目的変数も説明変数もカテゴリ変数ならクロス集計表
予測は例外事象に弱い
内挿=interpolation データ内で完結
外挿=extrapolarion データがない領域の予測
史上最高温度でのアイスの売上(1日2個食べる、暑すぎて外出控え買わない、他の流行
パーセンタイル 大小で並べた特定%分
幾何分布
試行を繰り返し、初めて成功するまでに必要な試行回数をモデル化する離散分布。
試行を繰り返し、初めて成功するまでに必要な試行回数をモデル化する離散分布。
例: コインを投げて初めて表が出るまでの回数。
二項分布
一定回数の試行で、成功する回数をモデル化する離散分布。
例: 10回コインを投げて表が出る回数。
負の二項分布
成功が指定回数起こるまでの試行回数をモデル化する離散分布。
例: サイコロを振って、5回目の「6」が出るまでの試行回数。
ポアゾン分布
単位時間または単位空間内での稀な事象の回数をモデル化する離散分布。
例: 1時間内に受ける顧客の電話数。
指数分布
事象が発生するまでの待ち時間をモデル化する連続分布。
例: 顧客が来るまでの時間。
ガンマ分布
複数の指数分布の待ち時間を足し合わせた分布。
例: 3件目の電話がかかるまでの待ち時間。
誤差 error
確率分布 probability distribution
正規分布 normal distribution aka ガウス分布
平均値 mean
分散 variance
最頻値 mode
標準偏差 standard deviation
確証バイアス confirmation bias
相関係数 correlation coefficient
交絡因子 confounding factor
因果効果 causal effect
平均処置効果 average treatment effect
実験群 experimental group
対照群 control group ゾロ投薬
重回帰分析 multiple regression analysis
サンプリング調査 sample survey
二項分布 binomial distribution
帰無仮説 null hypothesis
対立仮説 alternative hypothesis
有意水準 significance level
正規性 normality
等分散性 homoscedasticity
樹状図 dendrogram
汎化 generalization モデルが他のデータにも有効
再現性 Reproducibility 他者が同じデータと方法で同じ結果を得られる
Replicability 独立した研究で同様の結果を得られる
Replicability 独立した研究で同様の結果を得られる
特異性 specificity
妥当性 validity
納得感 plausibility
納得感 plausibility
整合性 coherence
類似性 analogy
誤謬 fallacy
■GitHub Actionsの動作内容はリポジトリ内に設定されている.github/workflows内のYMLにある
steps:
- name: Checkout
uses: actions/checkout@v4
@以下はバージョン、特定のコミットSHAにもできる @3df4ab11eba7bda6032a0b82a6bb43b11571feac #v4
onセクションにPushやPR作成やスケジュール実行等のトリガーや対象ブランチやパス等も書かれている
Secretsや環境変数は、Terraformでクラウドプロバイダーにアクセスする場合等で、GitHub Actionsのsecrets で認証情報が設定されていることが多い。これらはリポジトリのSettings > Secrets and variables > Actions で確認可能。
name: Deploy Terraform
on:
push:
branches:
- main #この場合、mainブランチへのpushでトリガーされる
jobs:
terraform:
runs-on: ubuntu-latest
steps:
- name: Checkout code
uses: actions/checkout@v3
- name: Setup Terraform
uses: hashicorp/setup-terraform@v2
with:
terraform_version: 1.4.0
- name: Initialize Terraform
run: terraform init
- name: Apply Terraform
run: terraform apply-auto-approve #terraform planなしじゃ