Try   HackMD

XspecによるX線スペクトル解析

最終更新: 2020-11-07 (榎戸輝揚)

tags: lecture,xspec

Xspec とは?

X線のスペクトル解析を行うパッケージはいくつかあり、その代表的な一つが Xspec です。

この Xspec は、NASA を中心に開発されてきた高エネルギー天文学のデータ解析の統合パッケージ "HEASoft" に含まれており、HEASoft をインストールする必要があります。

に従って、インストールできます。(昔はいろいろハマるところがありましたが、最近は、書かれている通りにやればインストールできます)

インストールして、Xspec を呼び出すことができるようになると、コマンドラインで対話的にスペクトルのフィットを行うことができます。もちろん、バッチ処理にすることもできます。

X線スペクトル解析の基本

以下、コマンドラインを使える人は実際に自分でやってもらえると良いのですが、そうでない方は以下に動画を作っていますので、これを見てもらえればと思います。

まず練習用のディレクトリを作ります。

mkdir practice
cd practice

必要なファイル一式は、GitHub: lecture_xspec に置いています。以下のようにダウンロードできます。GitHub が使える前提ですが、使えない方は zip file でダウンロードできるようにしています。

git clone https://github.com/tenoto/lecture_xspec.git

コマンドラインで以下のように入力してみましょう。EOF はヒアドキュメントと呼ばれていて、実際に自分でコマンドプロンプトから入力する際には、EOF は無視して順番に入れてみてください。

xspec <<EOF
data 1 sample/sim_ninja_crab_100s_bin100.fak 
none
resp 1 response/ninja_2gmc_whole_191224.rmf 
back 1 sample/sim_ninja_crab_100s_bkg.fak 
setplot energy
cpd /xw
plot ldata
ignore 1-1:**-1.0 50.0-**

これで表示されるのは、検出器で測定された「かに星雲」(Crab Nebula)のスペクトルです(注: ここでは実習のために、シミュレーションで作成したものです)。かに星雲は、X線天文衛星が打ち上げ後に真っ先に観測する標準光源としての意味のある天体ですね。

データは、 検出器で計数されたX線光子のカウント数をエネルギーに対してプロットしたもので、縦軸は Counts s

1 keV
1
で表示される。XSPEC の plot コマンドでは、誤差棒は Poisson 統計から予想される 1σ が default ではつくようになっています。

モデル関数でのフィット

このとき、検出器に入射するスペクトル情報を引き出したいわけです。この観測データを再現するモデル関数として、天体が「べき」関数で表せる X 線スペ クトルをもち、星間吸収を受けて検出器まで届いたと考える。これは「べき」関数 (power) と星間吸収 (phabs) の積 phabs * pow で与えられるとし、検出器に入射したエネルギー E (keV) を もつ X 線光子の個数は、

A(E)=exp(NHσ(E))×K(E1 keV)Γ photons cm
2
s
1
keV
1

と表せる。星間吸収において、

NH atoms cm
2
は水素柱密度、
σ(E)
cm
2
は光電吸収の断面積であり、「べき」関数において、K Photons cm−2 s−1 keV−1 は 1 keV で規格化した強度 (Normalization; Norm)、Γ は光子指数である。初期パラメータを入れてみる。

model phabs * power 
0.4
2.0
9.0 
fit

まず初期パラメータである程度、実験データに近いものを見つけたあとで、実験データを最もよく再現するモデルパラメータの最良推定値を探してみよう。

χ2 の最小値を求めるアルゴリズムには複数あり、XSPEC のデフォルトは Bevington の教科書で
の CURFIT ルーチンに基づいた Levenberg-Marquardt 法 (leven) を用いている。Levenberg-Marquardt 法は
χ2
の関数面の傾きから最小値を探索する最急降下法 (Steepest descent method)とガウス-ニュートン法 (Gauss-Newton method)を合わせたようなものである。このほかにCERN ライブラリの MINUIT 関数も用いることができ、

method simplex 

などとして切り替えることができる。method としては、migrad (MINUIT の MIGRAD), simplex (SIMPLEX)が用意されている。

χ2を最小化するようにモデル関数のパラメータを最適化しデータに合わせ込むには、

fit 200

とする。これで、200回の試行を繰り返しを行い (iteration)、

χ2の最小値
χmin2
を見つけ出す。収束した場合、下の図のように、データによく合うモデル関数(赤)が得られ、中図のように、両者の残差は 0 を中心として分布する。

Image Not Showing Possible Reasons
  • The image file may be corrupted
  • The server hosting the image is unavailable
  • The image path is incorrect
  • The image format is not supported
Learn More →

図: X線スペクトルデータ(黒点)とスペクトルのモデル関数(赤)。(top)検出器で計数された生のスペクトルと最適なモデル関数の解。(middle) モデルに対するデータの比。(data-model)/error が表示されている。(bottom) 検出器の応答関数を考慮して算出される、検出器に入射する前の段階での天体のスペクトルを
νFν
で表示している。星間吸収は含まれている。

試行回数を限定せずにフィットするには、

query yes
fit

などとする。フィットが収束すると、以下のような最適なパラメータと統計量が表示される。

========================================================================
Model phabs<1>*powerlaw<2> Source No.: 1   Active/On
Model Model Component  Parameter  Unit     Value
 par  comp
   1    1   phabs      nH         10^22    0.614496     +/-  0.127168     
   2    2   powerlaw   PhoIndex            2.14982      +/-  3.11995E-02  
   3    2   powerlaw   norm                10.9687      +/-  0.666350     
________________________________________________________________________


Fit statistic  : Chi-Squared                   52.66     using 66 bins.

Test statistic : Chi-Squared                   52.66     using 66 bins.
 Null hypothesis probability of 8.20e-01 with 63 degrees of freedom

これを読むと、66 ビンのデータを 3 パラメータのモデルでフィットしたので、自由度

ν は 66-3=63 であり、得られた
χ2=52.66
であるから、フィットの妥当性の目安として用いられる reduced chi-square の値は
χν2=0.84
程度となったことがわかる。

χ2 分布において、上記の自由度で
χ2
が得られる確率は、0.82 (Null hypothesis probability) であるから、もし 仮に 100 回同一の観測を行えたとすれば、このモデルに合致する観測結果が 82 回得られる、つまり最適なパラメータをもつモデル関数はデータをよく再現すると言える。このようにして妥当なモデル関数を得ることができた。

一般に、

0.05<χν2<1.20 程度の範囲であればモデル関数が妥当であると言える場合が多いが、最終的には null hypothesis probability に基づいた、つまり帰無仮説を背景にした考察に戻るべきである。なお、
χ2
が自由度
n
より非常に小さい場合、つまり
χν2
が 0 に近 い場合、フィットがよく合っていると考えるよりも、誤差評価に誤りがあるなどを疑うべ きであろう。また、このフィットにおいて保証されるのは「用いたモデル関数がデータを表すものとして適切であったか」であり、「そのモデル関数が物理的に適切かどうか」に は言及していないことに注意しておいた方がよい。フィットを合わせられることと、デー タを正しく物理解釈することは等価ではない。

なお、検出器の応答関数を考慮し、天体から地球に届いた段階での検出器に入る前の

νFν スペクトルは、

plot eeuf

とすれば表示され、上図の最後のパネルのような形になる。この天体は非熱的な「べき」成分の天体スペクトルが星間吸収を受けてきたものと解釈できる。

パラメータ誤差の推定

次のステップとして、モデル関数パラメータの誤差の範囲 (信頼できる値の範囲) を error コマンドを用いて求めよう。XSPEC の error コマンドでは、fit コマンドで求まった

χmin2 に対して、与えられた
χ2
を足した
χbound2=χmin2+χ2
以下の
χ2
を与えるようなパラメータ値の範囲を計算する。この際、誤差を求めたいパラメータ以外の、値を固定されていないフリーな全てのパラメータをふり
χ2
の最小化を行う。これは自由度 1 の
χ2
分布に対応し、XSPEC のデフォルト設定では 90% の信頼区間に対応する
χ2=2.73
の範囲から誤差を求める。星間吸収、「べき」の光子指数、強度はそれぞれパラメータ番号が 1, 2, 3 で、あれば、以下のように90% 信頼区間に対応する誤差を求めることができます。

XSPEC12>err 1,2,3
 Parameter   Confidence Range (2.706)
     1      0.40639     0.830787    (-0.208098,0.216298)
     2      2.09934      2.20165    (-0.0504843,0.0518309)
     3      9.93301      12.1332    (-1.03559,1.16464)

つまり、以下のように 90% 信頼区間の誤差を得ることができます。

  • 星間吸収:
    NH=(6.1±0.2)×1011
    cm
    2
  • 「べき」の光子指数:
    Γ=2.10±0.05
  • 1 keV での強度: normalization =
    11.01.0+1.2 
    photons sec
    1
    keV
    1
    cm
    2

実は、このデータは、以下のパラメータをもつモデルから擬似的に作成したもので、以下が本来の値です。

  • NH=3.8×1011
    cm
    2
  • Γ=2.1
  • Normalization =
    10
    photons sec
    1
    keV
    1
    cm
    2
    at 1 keV
  • ちなみに、Crab Nebula + Pulsar のスペクトルのパラメータは歴代のX線検出器でばらつきがある。Enoto Ph.D thesis Figure A.1など参照。

光子指数と強度は誤差の範囲で正しく得られています。星間吸収は低エネルギー側で決まるので、あまりうまくパラメータを得られていないようです。

ちなみに、90% 信頼区間の誤差はX線天文学でよく使われていたが、より一般的な

1σ誤差 (68% 信頼度) の場合には、
χ2=1.0
として、

XSPEC12>err 1.0 1,2,3
 Parameter   Confidence Range (1)
     1     0.487016     0.744919    (-0.127472,0.130431)
     2      2.11897      2.18116    (-0.0308556,0.0313376)
     3      10.3255      11.6591    (-0.6431,0.690492)

とすればよい。

これを確認するために、フリーなパラメータのうち 2 つについて

χ2値の 変化を描くことができる。今回、星間吸収はあまりうまく決まっていなかったので、
NH
の値を最適値に固定してみる。つまり、

freeze 1 

その上で、

steppar 2 2.08 2.22 100 3 9.8 12.2 100

などとすると、2 番目のパラメータ (今回の場合、べきの光子指数) を 2.08 から 2.22 まで 100 ステップ、3 番目のパラメータ (べきの強度) を 9.8 から 12.2 までの 100 ステップにそれぞれ分割し、100 × 100 のグリッド点について他のパラメータを最適化した上で計算する。この結果は

plot contour,,5,1.0,2.30,2.70,4.61,9.21

とすると、以下のように表示できる。

fig:sim_ninja_crab_100s_bin100_cont.jpg

この図では、

χ2 = 1.00, 2.30, 2.70, 4.61, 9.21 をもつ 5 つの confidence contour を描いてくれる。2 個のパラメータ空間において残り 1 個のパラメータを最適化して
χ2
を求めるので、この場合は自由度 2 の
χ2
分布に従い、3 つの confidence contour はそれぞれ信頼度 68% (
χ2=2.30
)、90% (
χ2=4.61
)、99% (
χ2=9.21
) に対応することになる。一方で、XSPEC の標準的な解析で error コマンドを使用する場合には、パラメータ 1 個 ずつについて誤差を計算していので自由度 1 の
χ2
分布であり、信頼度 68%、90%での 誤差は
χ2=1.0,2.7
で決まる。自由度 2 の 場合よりも誤差範囲はわずかに小さくなる。一般的な解析では error コマンドを使用することが多いが、どうのようなデータ解析を行っているのかには常に注意が必要である。また、実験結果をまとめる際に、
1σ
誤差をつけることが多いが、XSPEC では 90% 信頼度 での誤差がデフォルトのことが多い。いずれも定義して使えば問題ないが、注意しよう。

カウントレートとX線フラックス

検出器のカウントレートは、ignore コマンドで指定したエネルギー範囲について

XSPEC12>show rate

Spectral Data File: sample/sim_ninja_crab_100s_bin100.fak
 Assigned to Data Group 1 and Plot Group 1
Net count rate (cts/s) for Spectrum:1  1.018e+02 +/- 1.015e+00 (98.9 % total)
 Spectral data counts: 10296
 Model predicted rate: 101.304

とすると表示され、実測値は 101 counts s

1 (1-50 keV)とわかる。モデルの推定値や、合計のカウント数も表示される。

フラックスを求めるときは、

XSPEC12>flux 2.0 10.0
 Model Flux    3.2971 photons (2.1224e-08 ergs/cm^2/s) range (2.0000 - 10.000 keV)
XSPEC12>flux 2.0 10.0 err 200,68.3
Parameter distribution is derived from fit covariance matrix.
 Model Flux    3.2971 photons (2.1224e-08 ergs/cm^2/s) range (2.0000 - 10.000 keV)
     Error range     3.259 - 3.328    (2.097e-08 - 2.139e-08)  (68.30% confidence)

などとする。flux 2.0 10.0 としたときは、単に 2-10 keV のフラックスが求まり、

2.1×108 ergs cm
2
s
1
と求まる。flux 2.0 10.0 err 200, 68.3 などとすると、誤差も求めてくれる。この場合は、1
σ
誤差。詳しくは、ヘルプを調べるとよい。

ちなみに、よく使われる換算値は、1 Crab =

2.3×108 ergs s
1
cm
2
である。

X線光度は

Lx=4πd2Fx=1.2×1032(d/1 kpc)2(Fx/1012 ergs/sec/cm2) erg/s
なので、Crab まで 2 kpc の距離を考えると、このX線フラックスから推定されるX線光度は、
Lx=1.1×1037
ergs/s となる。

余談だが、Crab が銀河中心 (d=8 kpc)にいると、ちょうど

Lx=2×1038 ergs/s なので、中性子星のエディントン光度くらいになる。覚えておくと便利なときもある。

検出器の応答関数とフィットの関係

最後に XSPEC の中での検出器応答の扱いを簡単に補足しておく。 簡単な物理観測では、測定値に対して検出器の検出効率の補正を施せば、元々の物理量、観測量に簡単に戻すことが可能である。一方でX線観測においては、検出器に光子の全エネルギーを与える光電吸収のほかにも、一部分のエネルギーを与えるコンプトン散乱などの過程もある確率で生じている。そのため、検出器の実際の計数から元の X線スペクトルを一意的に求めることは、一般にはできない。そこで、X 線のモデルスペクトルを仮定し、検出器応答を受けた場合に予想されるカウント数のスペクトルを、実際の観測結果と比較する。そして

χ2最小化のアルゴリズムによって、再帰的に最適なモデルパラメータを求めるという方法を採用する。これは、

M(PIj)=iSA(Ei)R(Ei,PIj)M(Ei)Ei

と表せる。ここで、

  • M(PIj)
    : 検出されるイベント数 (counts cm
    2
    s
    1
    )
  • S
    : 有効面積 (cm
    2
    )
  • A(Ei)
    : 検出効率
  • R(Ei,PIj)
    : 検出器の応答関数
  • M(Ei)
    : 天体X線のモデル関数 (photons cm
    2
    s
    1
    keV
    1
    )
  • Ei
    : エネルギー幅 (keV)

である。エネルギー

Ei keVの単色X線で予想されるスペクトルは、
A(Ei)R(Ei,PIj)
であり、エネルギー
Ei
keVに対応する検出効率は
A(Ei)j=R(Ei,PIj)
と表せる。 一般に
R(Ei,PIj)
に逆行列が必ずしも見つかるわけではないため、
χ2
最小化アルゴリズ ムを採用しているとも考えられる。

XSPEC では

R(Ei,PIj) を RESP (Response File)、
ScotA(Ei)
を ARF (Ancillary Response File) として読み込むが、検出器ごとに S をどこが担うかは異なる場合がある。

たとえば、「すざく」の X 線 CCD カメラ (XIS) では、ARF、RESP を両方用いているが、硬 X 線検 出器の PIN 型半導体 (HXD-PIN) では、RESP のみに全てを含めるようになっている。また、硬 X 線検出器の GSO 結晶シンチレータ (HXD-GSO) では、若干の補正として ARF を用いるようにしている。それぞれがどのような関数形をしているかは、FTOOLS の fv コマンドなどで中身を見てみるとよい。

スペクトルのビンまとめと C-stat

統計の悪いデータを解析する際、ビンまとめという操作を行うことがある。grppha などのコマンドで行うことができる。

なお、昔はビンまとめすることが多かったが、これはエッジやラインなどのシャープな構造がもっている情報を消してしまうので、C-stat を使う人も増えている。

シミュレーションスペクトルを作る

観測を行う前に、どのようなスペクトルを持つかなどをシミュレーションしたいことも多い。こういった場合、fakeit という xspec のコマンドを使うことができる。

まず、仮定として、0.3 keV の温度をもつ中性子星が 1 kpc の距離にある場合にどう見えるかを考えてみよう。つまり、

  • 黒体放射の温度 kT = 0.3 keV
  • 放射の半径 R = 12 km
  • 距離 d = 1 kpc
  • 上記の仮定から、bbodyrad model の normalization
    =Rkm2/D10kpc2=1.44×104
  • 過去の観測例から、
    NH=5×1021
    cm
    2
    とする。

まず、xspec でソース・スペクトル(なんでもよい)とバックグラウンド、レスポンスを読み込んだ後、モデル関数を指定する。そして、fakeit コマンドで観測時間を指定する。これで、だいたいの統計誤差の大きさや、どれくらいのエネルギー帯域で検出ができそうかなどを把握することができる。

xspec 
data 1 response/ninja_empty.pi 
back 1 response/ninja_2gmc_whole_nxbcxb_200928.pi 
resp 1 response/ninja_2gmc_whole_191224.rmf 
model tbabs * bbodyrad
0.5
0.3
14400
fakeit
y

sim_ninja_nstar_5ks.fak
5000

すると、sim_ninja_nstar_5ks.fak と sim_ninja_nstar_5ks_bkg.fak という2つのファイルができる。これを読み込んで、同じモデルでフィットしてみると、以下のような結果を得る。

========================================================================
Model TBabs<1>*bbodyrad<2> Source No.: 1   Active/On
Model Model Component  Parameter  Unit     Value
 par  comp
   1    1   TBabs      nH         10^22    1.16972      +/-  0.393162     
   2    2   bbodyrad   kT         keV      0.279850     +/-  1.31500E-02  
   3    2   bbodyrad   norm                3.24012E+04  +/-  1.69984E+04  
________________________________________________________________________


Fit statistic  : Chi-Squared                   67.82     using 71 bins.

Test statistic : Chi-Squared                   67.82     using 71 bins.
 Null hypothesis probability of 4.83e-01 with 68 degrees of freedom
XSPEC12>err 1.0 1,2,3
 Parameter   Confidence Range (1)
     1     0.789101      1.58597    (-0.380622,0.416248)
     2     0.266361     0.293468    (-0.0134894,0.0136178)
     3      19324.3      56813.2    (-13076.9,24411.9)

参考サイト