quality-management-2023
尺度 | 他の尺度との関係 | JMP |
---|---|---|
比例尺度 | 間隔尺度に加えて比に意味がある | 連続尺度 |
間隔尺度 | 順序尺度に加えて間隔に意味がある(比には意味がない) | 連続尺度 |
順序尺度 | 名義尺度に加えて順序に意味がある(間隔や比には意味がない) | 順序尺度 |
名義尺度 | いかなる順序も間隔も比も意味がない | 名義尺度 |
ある変数が、その値の増減を、その値の比で語ることに意味がある単位を持っているとき、その変数の尺度を比例尺度という。長さ、重さ、金額など原点が0の意味を持つ変数は、比例尺度である。温度や湿度は、2倍という表現に意味がないので、比例尺度ではない。温度は摂氏と華氏で原点が異なる。湿度は相対湿度は、100%に相当する水分量が温度によって変わります。
比例尺度の変数は、平均、標準偏差、分散などを計算(推定)していいし、平均の差、平均の比、分散の差、分散の比にも興味を持っていい。
ある変数が、その値の増減を、差の値で語ることに意味がある単位を持っているとき、その変数の尺度が間隔尺度であるという。温度は間隔尺度である。
間隔尺度の変数も、平均、標準偏差などを計算(推定)していいし、平均の差、分散の差、分散の比にも興味を持っていい。ただし、平均の比は興味を持つ意味がない。
JMPでは、比例尺度と間隔尺度を合わせて、連続尺度と呼ぶ。
ある変数が、幾つかの値に分類され、しかもそれらの値がある順序を持っているとき、その変数の尺度が順序尺度であるという。顧客満足度について、「全体的に、弊社にどの程度満足していますか?」と問うて、次の5択からひとつを選び回答してもらう時、この変数は順序尺度である。
このように、はい・いいえ以外に段階を回答できるように選択肢を用意することを、リッカート尺度を用いる、と言う。
順序尺度は、平均や標準偏差、分散などの確率分布に関する統計量を計算(推定)するには、背景となる分布に関する仮定を要する。
ある変数の値が、分類に対応するが、値の間に順序が定まっていないとき、その変数の尺度が名義尺度であるという。性別、職業、最終学歴、都道府県、市区町村などの分類を記録した変数は名義尺度である。都道府県や市区町村に番号が付与されたとしても、その番号には整理のためのコードという意味以上はなく、これは数字に置き換えても名義尺度である。
名義尺度も、平均や標準偏差、分散などの確率分布に関する統計量を計算(推定)するには、背景となる分布に関する仮定を要する。たとえば郵便番号を7桁の整数に見立てて、全国の平均を計算すると、何が分かるだろうか。電話番号の平均も同様である。
尺度の理解という、JMPのマニュアルの項目を見ると、連続尺度と順序尺度、そして名義尺度が紹介されている。
JMP 15.2のマニュアルの尺度の理解の項目では、その3つのみだった。JMP 16.2のマニュアルの尺度の理解の項目ではデータの尺度に加えて、データ型である多重応答、非構造化テキスト、ベクトル、Noneも紹介に加えられた。
原因(cause)が、結果を引き起こす。原因は、ある物事や状態、変化を引き落とすもとにあること。事故の原因、病気の原因、のように使う。
ある物事を引き起こした要素が複数あるとき、それらを要因という。睡眠不足の要因は、夕食の時間が遅いこと、寝床でスマホを触ってしまうこと、など。寝床でスマホを触ってしまう原因は、そこでしか友だちとゆっくり話せないから。
要因には「重要な因子」と「主要な原因」の二つの解釈がある。主要な原因には、主要因という言葉もある。
2つの変数1と変数2が、互いに因果の関係にはないものの、増減が同じ向き、または反対の向きにあるとき、その2つの変数は相関関係にあるという。相関があることが直ちに、因果関係があることには綱がらない。
相関関係には方向がないため、鏃(矢尻)なしの線で結ぶ。
相関係数
成果 | FhG-ISI, GIT, PREST | Evidence | ATP | ETLA, WG, Technopolis |
---|---|---|---|---|
アウトプット (レザルト) | 短期的な成果 | 直接的な結果 | 研究成果 | 形式的側面 (活動のレベル) |
アウトカム | 中期的な成果 | 結果の効果 | イノベーションの成果 | 内容的側面 (中間的アウトカム) |
インパクト | 長期的な成果 | –- | 長期的な社会経済的効果 | 意図した結果以外の効果 (その他の社会経済的効果) |
たとえば、血圧降下剤を常用すると、血圧が下がるのがアウトプット、そのために生活習慣病の罹患率が下がるのがアウトカム、中長期的に国の医療費が伸びなくなるのがインパクト、だろうか。
予測したい変数、分布の違いを解析したい変数。
研究対象に関して、その変動に興味がある変数。因果関係の結果を測る変数。結果=アウトカム、とは限らないのは、上の説明を参考に。
研究対象に関して、他の変数の影響を受けて(分布が)変化する変数。
回帰分析の対象を、入出力系に見立て、観測される出力にあたる変数を応答変数という。
研究対象に関して実験条件を変えて実験をし、その結果を測定した変数を応答変数という。
原因から結果に矢印を結ぶ。
原因の候補の変数を原因系、原因よりは結果として取り上げることが望ましい変数を結果系と呼ぶ。
後述するように、原因の候補が複数あるなら、要因系と呼ぶのが望ましい。
研究対象の内部の影響を受けずに変化する変数を外生変数、研究対象の内部の影響を受けて変化する変数を内生変数という。
結果系の変数の(分布の)変化の原因の候補となる変数。
結果系の変数と一緒に変化していて、結果と共に変化しているように見えるが、結果系の変数の影響を受けているのではない変数。ここにあるように、因子、要因と区別する向きもある。
要因(primary factor)と因子(factor)は、使い分ける領域と、両方とも同じ意味で用いる領域がある。回帰分析のコンテキストでは、要因の候補を、そのまま要因と呼ぶ。
名義尺度と順序尺度を持つ変数のことを、要因と呼ぶ領域もある。
JMPでは、説明変数のうち、順序尺度や名義尺度を持つ変数を因子という。
結果系の変数と一緒に変化しているが、結果系の変数の影響を受けているのではない変数。
回帰分析の対象を、入出力系に見立て、入力にあたる変数を予測変数という。
目的変数 | 説明変数 | コンテキスト |
---|---|---|
目的変数 | 説明変数 | 回帰分析 |
従属変数 | 独立変数 | 回帰分析 |
アウトカム | 共変量, 要因 | 計量生物学 |
応答変数 | 予測変数 | JMP |
組み合わせは他にもあるはず。
目的変数のモデルを説明変数に基づいて推定する分析の総称。
たくさんある。全部、意味が異なる。
これもたくさんある。
予測変数の尺度 | 分析手法 |
---|---|
連続尺度 | 線形回帰分析, 分散分析, 共分散分析, 変量効果モデル, 応答曲面モデル, 対数線形分散モデル |
順序尺度 | ロジスティック回帰分析(順序ロジスティック手法) |
名義尺度 | ロジスティック回帰分析(名義ロジスティック手法) |
JMPのモデルのあてはめでは、
様々な変数の変換や変数の組み合わせを分析に含めることができる。
変数
変数
この時の回帰分析は
のという、切片が異なるが傾きは同じ2つのモデルを同時に推定することになる。これは、
と置き換えると、
と変形できる。このような表現を
重回帰分析に複数のダミー変数を含める際には、組み合わせの効果(これを交互作用という)も検討すると良いことがある。
用語 | 説明 |
---|---|
モデル | 推定したモデルのこと |
予測値 | モデルにデータを代入して, 誤差はない |
実測値 | データの中の応答変数の値そのまま |
残差 | 実測値ー予測値 |
てこ比 | その行(レコード, 観測値)を分析から取り除いた場合の, モデルの変化の大きさ. |
X残差 | その変数を応答変数, 他の変数を予測変数とした回帰分析の残差. (JMPでは残差にその変数の平均を加えている) |
てこ比残差 | その変数を予測変数から取り除いた回帰分析における残差. (JMPでは残差に応答変数の平均を加えている) |
用語 | 説明 |
---|---|
R2乗 | 重相関係数の平方, 決定係数のこと. 応答変数と予測値の相関係数の2乗. |
自由度調整済R2乗 | 自由度調整済み決定係数. |
誤差の平均二乗誤差 | 残差の2乗の平均. |
Yの平均 | 応答変数の平均. |
オブザベーション | サンプルの大きさ, 標本の大きさ, データの大きさのこと. 分析に用いたデータのレコード数. n数とも. |
用語 | 説明 |
---|---|
要因 | 分散分析に取り上げる因子。 |
自由度 | 要因の中の自由に変更できるパラメータの数。 |
平方和 | (個々の値ー平均)の2乗和のこと。 |
平均平方 | 平方和÷自由度 |
F値 | 検定統計量。要因のばらつきの大きさを, 誤差のばらつきの大きさと比較して相対的に, 有意に大きいかどうかをF分布に照らして検定する. その際に求める数値. |
p値(Prob>F) | 検定のp値. |
用語 | 説明 |
---|---|
項 | 変数のこと |
推定値 | 回帰係数, 偏回帰係数のこと |
標準誤差 | 回帰係数の信頼区間を推定する際の標準偏差 |
t値 | 回帰係数が |
p値(Prob> | t |
回帰係数
回帰係数は、目的変数の単位を変えると、変わる。
そこで、回帰係数に説明変数の標準偏差を掛けて、目的変数の標準偏差で割った標準化偏回帰係数を検討に用いることがある。
これは、
同じ。
違う。
これも違う。
回帰係数
この資料のp.54にありました。よく分からないんですけど、こういうの好きですか・・・?
経済産業省の健康経営度調査の法人単位のデータは、公益性の高い活動には法人単位のデータを貸与してくれるそう。
上のモデルのパラメータ(係数)を、データから推定した値。
てこ比プロットとてこ比プロットの詳細に基づいて説明する。
JMPが描くてこ比プロットは正しくは、効果のてこ比プロット(JMP)、偏回帰残差てこ比プロット(Belsley et al., 1980)、追加変数プロット(Cook and Weisberg, 1982)などと呼ばれる。任意の線形仮説に対して一般化されたてこ比プロットもある(Sall, 1990)。
ある予測変数X以外のすべての変数を用いて、応答変数Yの回帰分析を行い、求めた残差をY残差と呼ぶ。
ある予測変数X以外のすべての変数を用いて、予測変数Yの回帰分析を行い、求めた残差をX残差と呼ぶ。
そして、Y残差にYの平均を加えたものをYてこ比、X残差にXの平均を加えたものをXてこ比として、
横軸にX残差、縦軸にY残差をとって散布図を描いたのがJMPのてこ比プロットである。
横軸にてこ比+応答変数の平均(
JMPでは更に、Xてこ比を予測変数、Yてこ比を応答変数とした(単)回帰分析を行って、推定した回帰直線とその信頼区間を重ねて描く。この傾きは、すべての予測変数を用いた回帰分析でのXの回帰係数に一致する。青い破線の水平線は、Yの平均を表す。このグラフにおいて垂直方向の読み方は、点から赤い直線までの垂直距離はすべての変数を含んだ回帰分析の残差、点から青い水平線までの垂直距離はその変数が含まれていない回帰分析の残差、とする。水平方向は、(その変数を分析から取り除くなどして生じる)制約を課すことによって説明されなくなる差の大きさを反映している。端にある点は中央にある点よりも回帰係数の推定値に大きな影響を及ぼす。
このグラフは、回帰係数のt検定の結果と、次のように対応する。
応答変数の実測値と予測値の相関係数®の2乗であり、モデルのデータへの当てはまりの良さを表す指標。0以上1以下の値を取り、1に近いほど良い。
R2乗の値を上げるように変数を増やすと、実は単に意味や解釈がなくとも、変数をたくさん追加すれば、R2乗を1にできる。そこで、変数を選択する際に、変数を増やしすぎると、逆に減少するようなR2乗の調整を施した指標。
残差の標準偏差のこと。誤差の標準偏差の推定値になるので、こう呼ばれている。
データの中の応答変数の平均値。
n
変数選択で用いる基準。
変数選択で用いる基準。
メモ: モデル項の間に一次従属性がある場合でも、「パラメータ推定値」レポートでは、推定値がなるべく計算され、検定されます。ただし、一次従属性がある項は、推定値を一意的に決められないので、「バイアスあり」または「ゼロに固定」と表示されます。一次従属性がある場合を参照してください。
パラメータ推定値に対応するモデル項。「モデルのあてはめ」起動ウィンドウで[切片なし]オプションを選択した場合を除いて、最初の項は常に切片です。連続尺度の変数は、データテーブルの列名で表されます。連続尺度の列で高次の効果に使われているものは中心化される場合があります。名義尺度や順序尺度の効果では、列名のあとに、括弧で囲んだ水準値が表示されます。名義尺度および順序尺度の項のコード変換については、名義尺度効果のコード変換および因子(説明変数)の取り扱い方を参照してください。
各項のパラメータ推定値。これらは、モデル係数の推定値です。モデル項間に一次従属性がある場合、それらの項には「バイアスあり」または「ゼロに固定」と表示されます。一次従属性がある場合を参照してください。
各パラメータ推定値の標準誤差の推定値。
各パラメータの真の値は0かどうかという帰無仮説を検定します。t値は、「推定値」をその「標準誤差」で割ったものです。モデルに関するいくつかの仮定が満たされ、帰無仮説が成り立つときは、このt値はStudentのt分布に従います。
「真のパラメータ値は0である」という帰無仮説、「真のパラメータ値は0ではない」という対立仮説の両側検定に対するp値。
パラメータ推定値の両側95%信頼区間の下限。[回帰レポート]>[信頼区間をすべて表示]オプションを選択した場合、またはレポートを右クリックし、[列]>[下側95%]を選択した場合にのみ表示されます。
パラメータ推定値の両側95%信頼区間の上限。[回帰レポート]>[信頼区間をすべて表示]オプションを選択した場合、またはレポートを右クリックし、[列]>[上側95%]を選択した場合にのみ表示されます。
すべての項を平均0、分散1に標準化したときの回帰モデルから得られるパラメータ推定値(標準化偏回帰係数)。この列は、レポートを右クリックし、[列]>[標準β]を選択した場合のみ表示されます。
各項の分散拡大係数(VIF; Variance Inflation Factor)。この値が大きい場合、各項間に共線性があると考えられます。
i番目の項xiに対するVIFは、次式によって表されます。
この式において、Ri 2はxiを応答変数とし、その他の変数を説明変数として回帰分析したときの決定係数(R2乗)です。この列は、レポートを右クリックし、[列]>[VIF]を選択した場合のみ表示されます。
パラメータ推定値の相対分散の平方根(Goos and Jones, 2011, p. 25)。
これらは、標準誤差をRMSEで割った値です。この列は、レポートを右クリックし、[列]>[計画の標準誤差]を選択した場合のみ表示されます。
• 効果の検定は、一次従属性がある効果に対しても、検定が可能な場合には実行されます。一次従属性がある場合を参照してください。
• JMPにおけるパラメータ化と特異性への対処は、SASシステムのGLMプロシジャと異なります。パラメータ化と特異性についての詳細は、因子(説明変数)の取り扱い方を参照してください。
「効果の検定」レポートには、次のような列があります。
モデル内の効果。
効果に含まれるパラメータの個数。連続尺度の効果のパラメータ数は、1個です。名義尺度や順序尺度の主効果のパラメータ数は、その水準数よりも1つ少ない値です。交互作用のパラメータ数は、各主効果のパラメータ数の積です。
各効果に対する検定の自由度。通常、「パラメータ数」と「自由度」は同じ値ですが、説明変数間に一次従属性がある場合は異なります。そのような場合は、その効果に関連する少なくとも1つのパラメータが検定できなくなり、「自由度」が「パラメータ数」よりも小さくなります。「自由度」が「パラメータ数」より小さいときは、レポートの行の右側に「足りない自由度」という注釈が表示されます。なお、誤差に自由度がない場合は、「効果の検定」で使われているF検定は行えません。「効果の検定」レポートを参照してください。
「効果が0である」という帰無仮説を検定するための平方和。
「効果が0である」という帰無仮説を検定するためのF統計量。効果の平均平方を誤差の平均平方で割った比です。平均平方は、平方和を自由度で割ったものです。
「効果が0である」という帰無仮説を検定するp値。
平均平方は、効果の平方和を自由度で割ったものです。
von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
J Clin Epidemiol. 2008 Apr;61(4):344-9. PMID: 18313558
von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
Lancet. 2007 Oct 20;370(9596):1453-7. PMID: 18064739
von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
Epidemiology. 2007 Nov;18(6):800-4. PMID: 18049194
von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
Bull World Health Organ. 2007 Nov;85(11):867-72. PMID: 18038077
von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
Prev Med. 2007 Oct;45(4):247-51. Epub 2007 Sep 4. PMID: 17950122
von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
BMJ. 2007 Oct 20;335(7624):806-8. No abstract available. PMID: 17947786
von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
PLoS Med. 2007 Oct 16;4(10):e296. PMID: 17941714
von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) statement: guidelines for reporting observational studies.
Ann Intern Med. 2007 Oct 16;147(8):573-7. Erratum in: Ann Intern Med. 2008 Jan 15;148(2):168. PMID: 17938396
Vandenbroucke JP, von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ,Poole C, Schlesselman JJ, Egger M; STROBE Initiative.
Strengthening the Reporting of Observational Studies in Epidemiology (STROBE):explanation and elaboration.
Epidemiology. 2007 Nov;18(6):805-35. PMID: 18049195
Vandenbroucke JP, von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ,Poole C, Schlesselman JJ, Egger M; STROBE initiative.
Strengthening the Reporting of Observational Studies in Epidemiology (STROBE):explanation and elaboration.
Ann Intern Med. 2007 Oct 16;147(8):W163-94. PMID: 17938389
Vandenbroucke JP, von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ,Poole C, Schlesselman JJ, Egger M; STROBE Initiative.
Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): explanation and elaboration.
PLoS Med. 2007 Oct 16;4(10):e297. PMID: 17941715