Try   HackMD

回帰分析用語集

tags: quality-management-2023

変数の尺度

尺度間の関係

尺度 他の尺度との関係 JMP
比例尺度 間隔尺度に加えて比に意味がある 連続尺度
間隔尺度 順序尺度に加えて間隔に意味がある(比には意味がない) 連続尺度
順序尺度 名義尺度に加えて順序に意味がある(間隔や比には意味がない) 順序尺度
名義尺度 いかなる順序も間隔も比も意味がない 名義尺度

比例尺度

ある変数が、その値の増減を、その値の比で語ることに意味がある単位を持っているとき、その変数の尺度を比例尺度という。長さ、重さ、金額など原点が0の意味を持つ変数は、比例尺度である。温度や湿度は、2倍という表現に意味がないので、比例尺度ではない。温度は摂氏と華氏で原点が異なる。湿度は相対湿度は、100%に相当する水分量が温度によって変わります。

比例尺度の変数は、平均、標準偏差、分散などを計算(推定)していいし、平均の差、平均の比、分散の差、分散の比にも興味を持っていい。

間隔尺度

ある変数が、その値の増減を、差の値で語ることに意味がある単位を持っているとき、その変数の尺度が間隔尺度であるという。温度は間隔尺度である。

間隔尺度の変数も、平均、標準偏差などを計算(推定)していいし、平均の差、分散の差、分散の比にも興味を持っていい。ただし、平均の比は興味を持つ意味がない。

連続尺度 (JMP)

JMPでは、比例尺度と間隔尺度を合わせて、連続尺度と呼ぶ。

順序尺度 (JMP)

ある変数が、幾つかの値に分類され、しかもそれらの値がある順序を持っているとき、その変数の尺度が順序尺度であるという。顧客満足度について、「全体的に、弊社にどの程度満足していますか?」と問うて、次の5択からひとつを選び回答してもらう時、この変数は順序尺度である。

  • とても満足
  • やや満足
  • どちらとも言えない
  • やや不満
  • とても不満

このように、はい・いいえ以外に段階を回答できるように選択肢を用意することを、リッカート尺度を用いる、と言う。

順序尺度は、平均や標準偏差、分散などの確率分布に関する統計量を計算(推定)するには、背景となる分布に関する仮定を要する。

名義尺度 (JMP)

ある変数の値が、分類に対応するが、値の間に順序が定まっていないとき、その変数の尺度が名義尺度であるという。性別、職業、最終学歴、都道府県、市区町村などの分類を記録した変数は名義尺度である。都道府県や市区町村に番号が付与されたとしても、その番号には整理のためのコードという意味以上はなく、これは数字に置き換えても名義尺度である。

名義尺度も、平均や標準偏差、分散などの確率分布に関する統計量を計算(推定)するには、背景となる分布に関する仮定を要する。たとえば郵便番号を7桁の整数に見立てて、全国の平均を計算すると、何が分かるだろうか。電話番号の平均も同様である。

JMPで用いるデータの尺度

尺度の理解という、JMPのマニュアルの項目を見ると、連続尺度と順序尺度、そして名義尺度が紹介されている。

JMP 15.2のマニュアルの尺度の理解の項目では、その3つのみだった。JMP 16.2のマニュアルの尺度の理解の項目ではデータの尺度に加えて、データ型である多重応答、非構造化テキスト、ベクトル、Noneも紹介に加えられた。

回帰分析に現れる変数

原因と要因

原因(cause)が、結果を引き起こす。原因は、ある物事や状態、変化を引き落とすもとにあること。事故の原因、病気の原因、のように使う。







R



原因

原因



結果

結果



原因->結果





ある物事を引き起こした要素が複数あるとき、それらを要因という。睡眠不足の要因は、夕食の時間が遅いこと、寝床でスマホを触ってしまうこと、など。寝床でスマホを触ってしまう原因は、そこでしか友だちとゆっくり話せないから。







R



要因1

要因1



結果

結果



要因1->結果





要因2

要因2



要因2->結果





要因3

要因3



要因3->結果





要因には「重要な因子」と「主要な原因」の二つの解釈がある。主要な原因には、主要因という言葉もある。

相関

2つの変数1と変数2が、互いに因果の関係にはないものの、増減が同じ向き、または反対の向きにあるとき、その2つの変数は相関関係にあるという。相関があることが直ちに、因果関係があることには綱がらない。

相関関係には方向がないため、鏃(矢尻)なしの線で結ぶ。







R



変数1

変数1



変数2

変数2



変数1--変数2




相関係数

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

Image Not Showing Possible Reasons
  • The image was uploaded to a note which you don't have access to
  • The note which the image was originally uploaded to has been deleted
Learn More →

結果 (アウトプットとアウトカムとインパクト)

成果 FhG-ISI, GIT, PREST Evidence ATP ETLA, WG, Technopolis
アウトプット (レザルト) 短期的な成果 直接的な結果 研究成果 形式的側面 (活動のレベル)
アウトカム 中期的な成果 結果の効果 イノベーションの成果 内容的側面 (中間的アウトカム)
インパクト 長期的な成果 - 長期的な社会経済的効果 意図した結果以外の効果 (その他の社会経済的効果)

たとえば、血圧降下剤を常用すると、血圧が下がるのがアウトプット、そのために生活習慣病の罹患率が下がるのがアウトカム、中長期的に国の医療費が伸びなくなるのがインパクト、だろうか。

結果系

目的変数

予測したい変数、分布の違いを解析したい変数。

結果変数

研究対象に関して、その変動に興味がある変数。因果関係の結果を測る変数。結果=アウトカム、とは限らないのは、上の説明を参考に。

従属変数

研究対象に関して、他の変数の影響を受けて(分布が)変化する変数。

応答変数 (JMP)

回帰分析の対象を、入出力系に見立て、観測される出力にあたる変数を応答変数という。







R



f

f



Y

Y



f->Y





X1

X1



X1->f





X2

X2



X2->f





X3

X3



X3->f





研究対象に関して実験条件を変えて実験をし、その結果を測定した変数を応答変数という。

原因系と結果系

原因から結果に矢印を結ぶ。







R


cluster_2

結果系


cluster_1

原因系



X1

X1



Y1

Y1



X1->Y1





X2

X2



X2->Y1





Y2

Y2



X2->Y2





X3

X3



X3->Y2





原因の候補の変数を原因系、原因よりは結果として取り上げることが望ましい変数を結果系と呼ぶ。
後述するように、原因の候補が複数あるなら、要因系と呼ぶのが望ましい。

外生変数と内生変数

研究対象の内部の影響を受けずに変化する変数を外生変数、研究対象の内部の影響を受けて変化する変数を内生変数という。







R


cluster

研究対象



X1

X1



Y1

Y1



X1->Y1





Y2

Y2



Y1->Y2





X2

X2



X2->Y1





X2->Y2





X3

X3



X3->Y2





原因系

説明変数

結果系の変数の(分布の)変化の原因の候補となる変数。

共変量

結果系の変数と一緒に変化していて、結果と共に変化しているように見えるが、結果系の変数の影響を受けているのではない変数。ここにあるように、因子、要因と区別する向きもある。

要因

要因(primary factor)と因子(factor)は、使い分ける領域と、両方とも同じ意味で用いる領域がある。回帰分析のコンテキストでは、要因の候補を、そのまま要因と呼ぶ。

名義尺度と順序尺度を持つ変数のことを、要因と呼ぶ領域もある。

因子 (JMP)

JMPでは、説明変数のうち、順序尺度や名義尺度を持つ変数を因子という。

独立変数

結果系の変数と一緒に変化しているが、結果系の変数の影響を受けているのではない変数。

予測変数 (JMP)

回帰分析の対象を、入出力系に見立て、入力にあたる変数を予測変数という。







R



f

f



Y

Y



f->Y





X1

X1



X1->f





X2

X2



X2->f





X3

X3



X3->f





変数の呼び名の組み合わせ

目的変数 説明変数 コンテキスト
目的変数 説明変数 回帰分析
従属変数 独立変数 回帰分析
アウトカム 共変量, 要因 計量生物学
応答変数 予測変数 JMP

組み合わせは他にもあるはず。

回帰分析

目的変数のモデルを説明変数に基づいて推定する分析の総称。

単回帰分析、重回帰分析

  • 単回帰分析は目的変数と説明変数が1つずつの場合の回帰分析。
  • 重回帰分析は目的変数が1つで、説明変数が複数の場合の回帰分析。

○○回帰

たくさんある。全部、意味が異なる。

  • 線形回帰
  • ロジスティック回帰
  • ポアソン回帰
  • 対数線形回帰
  • スパース回帰
  • プロビット回帰
  • ロジット回帰
  • リッジ回帰
  • ラッソ回帰
  • L1回帰
  • 多段回帰
  • 非線形回帰
  • セミパラメトリック回帰
  • スプライン非線形回帰

○○モデル

これもたくさんある。

  • 線形回帰モデル
  • 非線形回帰モデル
  • ポアソン回帰モデル
  • ロジスティック回帰モデル
  • スプラインモデル
  • 区分多項式モデル

予測変数の尺度と○○回帰、○○モデル (JMP)

予測変数の尺度 分析手法
連続尺度 線形回帰分析, 分散分析, 共分散分析, 変量効果モデル, 応答曲面モデル, 対数線形分散モデル
順序尺度 ロジスティック回帰分析(順序ロジスティック手法)
名義尺度 ロジスティック回帰分析(名義ロジスティック手法)

線形モデル

y=β0+β1x1++βpxp+ϵ

yは、定数の
β0
x1
1
増加すると
β1
増加する効果、
x2
1
増加すると
β2
増加する効果、
xp
1
増加すると
βp
増加する効果、そして平均が
0
で標準偏差が
σ
の誤差
ϵ
、これらの足し算で決まる。

モデルに用いる変数

JMPのモデルのあてはめでは、
様々な変数の変換や変数の組み合わせを分析に含めることができる。

ダミー変数

変数

xが連続尺度なら、一つの回帰係数
β
が推定される。

変数

xが順序尺度または名義尺度なら、複数の回帰係数
β
が推定される。例えば回帰分析をするデータが、横軸
x1
、縦軸
y
に加えて、青(
x2=
)と橙(
x2=
)という変数を備えていたとしよう。
x2
は名義尺度である。

この時の回帰分析は

y=(β0+β2)+β1x1+ϵ y=(β0+β2)+β1x1+ϵ

のという、切片が異なるが傾きは同じ2つのモデルを同時に推定することになる。これは、

x2
x2={0()1()

と置き換えると、

y=β0+(β2β2)x2+β1x1+ϵ

と変形できる。このような表現を

x2にダミー変数
x2
を用いる、という。JMPのダミー変数への変換は名義尺度効果のコード変換順序尺度の因子に説明がある。

重回帰分析に複数のダミー変数を含める際には、組み合わせの効果(これを交互作用という)も検討すると良いことがある。

用語の整理

用語 説明
モデル 推定したモデルのこと
予測値 モデルにデータを代入して, 誤差はない
ϵ=0
)として算出した値. 応答変数の予測値にあたる。
実測値 データの中の応答変数の値そのまま
残差 実測値ー予測値
てこ比 その行(レコード, 観測値)を分析から取り除いた場合の, モデルの変化の大きさ.
X残差 その変数を応答変数, 他の変数を予測変数とした回帰分析の残差. (JMPでは残差にその変数の平均を加えている)
てこ比残差 その変数を予測変数から取り除いた回帰分析における残差. (JMPでは残差に応答変数の平均を加えている)
用語 説明
R2乗 重相関係数の平方, 決定係数のこと. 応答変数と予測値の相関係数の2乗.
自由度調整済R2乗 自由度調整済み決定係数.
誤差の平均二乗誤差 残差の2乗の平均.
Yの平均 応答変数の平均.
オブザベーション サンプルの大きさ, 標本の大きさ, データの大きさのこと. 分析に用いたデータのレコード数. n数とも.
用語 説明
要因 分散分析に取り上げる因子。
自由度 要因の中の自由に変更できるパラメータの数。
平方和 (個々の値ー平均)の2乗和のこと。
平均平方 平方和÷自由度
F値 検定統計量。要因のばらつきの大きさを, 誤差のばらつきの大きさと比較して相対的に, 有意に大きいかどうかをF分布に照らして検定する. その際に求める数値.
p値(Prob>F) 検定のp値.
α=0.05
の検定なら, この値が0.05より小さければ, 帰無仮説を棄却して, 有意という.
用語 説明
変数のこと
推定値 回帰係数, 偏回帰係数のこと
標準誤差 回帰係数の信頼区間を推定する際の標準偏差
t値 回帰係数が
0
かどうかを仮説検定するために計算する数値。
p値(Prob> t

回帰係数と標準化偏回帰係数

回帰係数

βjの大きさが、効果の大きさという意味を単純に持つ訳ではない。
x1
が投資額だった場合、
1
円あたり
50
円増加する効果を産むということは、
y
の単位を万円に変えると、
1
円あたり
0.005
万円増加する効果を産むことと等しい。
回帰係数は、目的変数の単位を変えると、変わる。

そこで、回帰係数に説明変数の標準偏差を掛けて、目的変数の標準偏差で割った標準化偏回帰係数を検討に用いることがある。

bj=sd(xj)sd(y)βj

これは、

xjを標準偏差1つ分動かした時に、
y
の平均が標準偏差の
bj
倍動くという解釈が可能である。

回帰係数と偏回帰係数

同じ。

相関係数と偏相関係数

違う。

偏回帰係数と偏相関係数

これも違う。

線形モデルのモデル図の一般形







A



x1

x1



y

y



x1->y


β1



x2

x2



x2->y


β2









xp

xp



xp->y


βp



ϵ

ϵ



ϵ->y


σ



回帰係数

βj,j=1,...,pはそれぞれ、説明変数
xj
以外を固定して、
xj
だけを1単位増加させると、
y
(の平均)が
βj
増加する、という意味を持つ。

σは、
x1,...,xp
の影響を受けて変化する
y
は、さらに標準偏差が
σ
の誤差
ϵ
の影響を受けてばらつく、という意味を持つ。

モデル図の例

この資料のp.54にありました。よく分からないんですけど、こういうの好きですか・・・?







A


cluster_1

間接効果


cluster_2

共変量



健康投資度

健康投資度



仕事のパフォーマンス

仕事のパフォーマンス



健康投資度->仕事のパフォーマンス





ヘルスリテラシー

ヘルスリテラシー



健康投資度->ヘルスリテラシー





生活習慣

生活習慣



健康投資度->生活習慣





健康アウトカム、自覚的健康度

健康アウトカム、自覚的健康度



健康投資度->健康アウトカム、自覚的健康度





働きがい指標と自社就職推奨

働きがい指標と自社就職推奨



健康投資度->働きがい指標と自社就職推奨





ヘルスリテラシー->仕事のパフォーマンス





生活習慣->仕事のパフォーマンス





生活習慣->仕事のパフォーマンス





健康アウトカム、自覚的健康度->仕事のパフォーマンス





働きがい指標と自社就職推奨->仕事のパフォーマンス





企業規模

企業規模



企業規模->健康投資度





企業規模->仕事のパフォーマンス





性別

性別



性別->健康投資度





性別->仕事のパフォーマンス





年齢

年齢



年齢->健康投資度





年齢->仕事のパフォーマンス





役職

役職



役職->健康投資度





役職->仕事のパフォーマンス





年収

年収



年収->健康投資度





年収->仕事のパフォーマンス





経済産業省の健康経営度調査の法人単位のデータは、公益性の高い活動には法人単位のデータを貸与してくれるそう。

回帰係数、係数

上のモデルのパラメータ(係数)を、データから推定した値。

てこ比プロット

てこ比プロットてこ比プロットの詳細に基づいて説明する。

JMPが描くてこ比プロットは正しくは、効果のてこ比プロット(JMP)、偏回帰残差てこ比プロット(Belsley et al., 1980)、追加変数プロット(Cook and Weisberg, 1982)などと呼ばれる。任意の線形仮説に対して一般化されたてこ比プロットもある(Sall, 1990)。

ある予測変数X以外のすべての変数を用いて、応答変数Yの回帰分析を行い、求めた残差をY残差と呼ぶ。
ある予測変数X以外のすべての変数を用いて、予測変数Yの回帰分析を行い、求めた残差をX残差と呼ぶ。
そして、Y残差にYの平均を加えたものをYてこ比、X残差にXの平均を加えたものをXてこ比として、
横軸にX残差、縦軸にY残差をとって散布図を描いたのがJMPのてこ比プロットである。

横軸にてこ比+応答変数の平均(

r0r+(y))を、横軸に(例えばある変数の回帰係数が0であるなどの)制約されたモデルの残差
r0
を取って打点する。

JMPでは更に、Xてこ比を予測変数、Yてこ比を応答変数とした(単)回帰分析を行って、推定した回帰直線とその信頼区間を重ねて描く。この傾きは、すべての予測変数を用いた回帰分析でのXの回帰係数に一致する。青い破線の水平線は、Yの平均を表す。このグラフにおいて垂直方向の読み方は、点から赤い直線までの垂直距離はすべての変数を含んだ回帰分析の残差、点から青い水平線までの垂直距離はその変数が含まれていない回帰分析の残差、とする。水平方向は、(その変数を分析から取り除くなどして生じる)制約を課すことによって説明されなくなる差の大きさを反映している。端にある点は中央にある点よりも回帰係数の推定値に大きな影響を及ぼす。

このグラフは、回帰係数のt検定の結果と、次のように対応する。

あてはめの要約

あてはめの要約

R2乗

応答変数の実測値と予測値の相関係数®の2乗であり、モデルのデータへの当てはまりの良さを表す指標。0以上1以下の値を取り、1に近いほど良い。

自由度調整済みR2乗

R2乗の値を上げるように変数を増やすと、実は単に意味や解釈がなくとも、変数をたくさん追加すれば、R2乗を1にできる。そこで、変数を選択する際に、変数を増やしすぎると、逆に減少するようなR2乗の調整を施した指標。

誤差の標準偏差

残差の標準偏差のこと。誤差の標準偏差の推定値になるので、こう呼ばれている。

Yの平均

データの中の応答変数の平均値。

オブザベーション

n

AICc

変数選択で用いる基準。

BIC

変数選択で用いる基準。

分散分析

分散分析

パラメータ推定値

パラメータ推定値

メモ: モデル項の間に一次従属性がある場合でも、「パラメータ推定値」レポートでは、推定値がなるべく計算され、検定されます。ただし、一次従属性がある項は、推定値を一意的に決められないので、「バイアスあり」または「ゼロに固定」と表示されます。一次従属性がある場合を参照してください。

パラメータ推定値に対応するモデル項。「モデルのあてはめ」起動ウィンドウで[切片なし]オプションを選択した場合を除いて、最初の項は常に切片です。連続尺度の変数は、データテーブルの列名で表されます。連続尺度の列で高次の効果に使われているものは中心化される場合があります。名義尺度や順序尺度の効果では、列名のあとに、括弧で囲んだ水準値が表示されます。名義尺度および順序尺度の項のコード変換については、名義尺度効果のコード変換および因子(説明変数)の取り扱い方を参照してください。

推定値

各項のパラメータ推定値。これらは、モデル係数の推定値です。モデル項間に一次従属性がある場合、それらの項には「バイアスあり」または「ゼロに固定」と表示されます。一次従属性がある場合を参照してください。

標準誤差

各パラメータ推定値の標準誤差の推定値。

t値

各パラメータの真の値は0かどうかという帰無仮説を検定します。t値は、「推定値」をその「標準誤差」で割ったものです。モデルに関するいくつかの仮定が満たされ、帰無仮説が成り立つときは、このt値はStudentのt分布に従います。

p値(Prob>|t|)

「真のパラメータ値は0である」という帰無仮説、「真のパラメータ値は0ではない」という対立仮説の両側検定に対するp値。

下側95%

パラメータ推定値の両側95%信頼区間の下限。[回帰レポート]>[信頼区間をすべて表示]オプションを選択した場合、またはレポートを右クリックし、[列]>[下側95%]を選択した場合にのみ表示されます。

上側95%

パラメータ推定値の両側95%信頼区間の上限。[回帰レポート]>[信頼区間をすべて表示]オプションを選択した場合、またはレポートを右クリックし、[列]>[上側95%]を選択した場合にのみ表示されます。

標準β

すべての項を平均0、分散1に標準化したときの回帰モデルから得られるパラメータ推定値(標準化偏回帰係数)。この列は、レポートを右クリックし、[列]>[標準β]を選択した場合のみ表示されます。

VIF

各項の分散拡大係数(VIF; Variance Inflation Factor)。この値が大きい場合、各項間に共線性があると考えられます。

i番目の項xiに対するVIFは、次式によって表されます。

この式において、Ri 2はxiを応答変数とし、その他の変数を説明変数として回帰分析したときの決定係数(R2乗)です。この列は、レポートを右クリックし、[列]>[VIF]を選択した場合のみ表示されます。

計画の標準誤差

パラメータ推定値の相対分散の平方根(Goos and Jones, 2011, p. 25)。

これらは、標準誤差をRMSEで割った値です。この列は、レポートを右クリックし、[列]>[計画の標準誤差]を選択した場合のみ表示されます。

効果の検定

効果の検定

• 効果の検定は、一次従属性がある効果に対しても、検定が可能な場合には実行されます。一次従属性がある場合を参照してください。
• JMPにおけるパラメータ化と特異性への対処は、SASシステムのGLMプロシジャと異なります。パラメータ化と特異性についての詳細は、因子(説明変数)の取り扱い方を参照してください。
「効果の検定」レポートには、次のような列があります。

要因

モデル内の効果。

パラメータ数

効果に含まれるパラメータの個数。連続尺度の効果のパラメータ数は、1個です。名義尺度や順序尺度の主効果のパラメータ数は、その水準数よりも1つ少ない値です。交互作用のパラメータ数は、各主効果のパラメータ数の積です。

自由度

各効果に対する検定の自由度。通常、「パラメータ数」と「自由度」は同じ値ですが、説明変数間に一次従属性がある場合は異なります。そのような場合は、その効果に関連する少なくとも1つのパラメータが検定できなくなり、「自由度」が「パラメータ数」よりも小さくなります。「自由度」が「パラメータ数」より小さいときは、レポートの行の右側に「足りない自由度」という注釈が表示されます。なお、誤差に自由度がない場合は、「効果の検定」で使われているF検定は行えません。「効果の検定」レポートを参照してください。

平方和

「効果が0である」という帰無仮説を検定するための平方和。

F値

「効果が0である」という帰無仮説を検定するためのF統計量。効果の平均平方を誤差の平均平方で割った比です。平均平方は、平方和を自由度で割ったものです。

p値(Prob > F)

「効果が0である」という帰無仮説を検定するp値。

平均平方

平均平方は、効果の平方和を自由度で割ったものです。

効果の詳細

効果の詳細

声明

STROBE声明

Citations

von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
J Clin Epidemiol. 2008 Apr;61(4):344-9. PMID: 18313558

von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
Lancet. 2007 Oct 20;370(9596):1453-7. PMID: 18064739

von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
Epidemiology. 2007 Nov;18(6):800-4. PMID: 18049194

von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
Bull World Health Organ. 2007 Nov;85(11):867-72. PMID: 18038077

von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
Prev Med. 2007 Oct;45(4):247-51. Epub 2007 Sep 4. PMID: 17950122

von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
BMJ. 2007 Oct 20;335(7624):806-8. No abstract available. PMID: 17947786

von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE)statement: guidelines for reporting observational studies.
PLoS Med. 2007 Oct 16;4(10):e296. PMID: 17941714

von Elm E, Altman DG, Egger M, Pocock SJ, Gøtzsche PC, Vandenbroucke JP; STROBE Initiative.
The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) statement: guidelines for reporting observational studies.
Ann Intern Med. 2007 Oct 16;147(8):573-7. Erratum in: Ann Intern Med. 2008 Jan 15;148(2):168. PMID: 17938396

STROBE E&E

Vandenbroucke JP, von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ,Poole C, Schlesselman JJ, Egger M; STROBE Initiative.
Strengthening the Reporting of Observational Studies in Epidemiology (STROBE):explanation and elaboration.
Epidemiology. 2007 Nov;18(6):805-35. PMID: 18049195

Vandenbroucke JP, von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ,Poole C, Schlesselman JJ, Egger M; STROBE initiative.
Strengthening the Reporting of Observational Studies in Epidemiology (STROBE):explanation and elaboration.
Ann Intern Med. 2007 Oct 16;147(8):W163-94. PMID: 17938389

Vandenbroucke JP, von Elm E, Altman DG, Gøtzsche PC, Mulrow CD, Pocock SJ,Poole C, Schlesselman JJ, Egger M; STROBE Initiative.
Strengthening the Reporting of Observational Studies in Epidemiology (STROBE): explanation and elaboration.
PLoS Med. 2007 Oct 16;4(10):e297. PMID: 17941715