# single cell ATAC sequencing (scATAC-seq) メモ ### 予想以上に細胞数が多い場合の解釈について ○[GEM を細胞数よりも多く準備する理由](https://bioinformatics.stackexchange.com/questions/8678/why-do-i-have-10-000-cells-in-the-10x-matrix-produced-by-cellranger) ○[10x scATAC の入門 (丁寧でわかりやすい)](https://informatics.sydney.edu.au/training/coursedocs/SingleCellRNASeq_10X_June19.pdf) ○[CellRanger-atac output HTML report の見方](https://support.10xgenomics.com/permalink/5SD6TlDWVvnqfK56o2syiH) ○[CellRanger-atac のアルゴリズム概要](https://support.10xgenomics.com/single-cell-atac/software/pipelines/latest/algorithms/overview) ○[wetting failure について](https://kb.10xgenomics.com/hc/en-us/articles/218135863-What-causes-wetting-failures-) ### 一般的な解析の流れ [1] **CellRanger を用いてシーケンスリードからカウントデータのテーブルを作成する行程** ここで、カウントデータとは列がサンプル (barcode)、行が各 chromatin accessibility site (クロマチン上で peak がカウントされた領域) になります。peak accessibility matrix, peak barcode matrix と呼ばれていることもあります。 [2] **基本的解析** RNA-seq データでヒートマップを描写した際、発現量の類似性を元にサンプルをクラスタリングしています。同じように barcode peak matrix でもクラスタリングしたり、本来の高次元データを低次元で可視化したりします。Loupe cell browser で閲覧しているものが、この項目に該当すると思います。 [3] **differential accessibility analysis** RNA-seq の Differentially Expressed Gene (DEG) 解析に相当します。2群 (control vs 変異など) 間で peak が異なる領域を検出する方法です。ChIP-seq や bulk の ATAC-seq では、MACS2 を用いる peak calling のような解析を実施します。 [4] **trajectory inference** single cell RNA-seq では、発現の似た細胞を順序立てて並べることで経時的ではないデータからも細胞分化や発生過程を推定する方法です。同じ考えを scATAC-seq のデータに適用した場合、chromatin accesibility 状態 の変化過程を擬似的に捉えることができます。 [5] **cis-element network 解析** cis-regulatory element の制御ネットワークを推定する方法です。転写制御ネットワークに関わる制御構造を推定する方法です。 ## snapATAC のインストール ``` conda create -n scatac python=2.7 conda activate scatac conda install -c r r=3.5 conda install -c r-devtools conda install -c r r-stringi conda install -c r r-igraph conda install -c r r-rcurl conda install -c r r-ggplot2 conda install -c conda-forge r-dosnow conda install -c conda-forge r-plot3d conda install -c bioconda bioconductor-rhdf5 ``` R を実行 $ R > library(devtools) > install_github("r3fang/SnapATAC") で途中、update を尋ねられた時 3: None を選択。以上の package が入っているとうまくいく可能性がある。 ### 参考 scATAC-seq については、総説 https://www.nature.com/articles/s41576-018-0089-8 や手法の比較論文 https://genomebiology.biomedcentral.com/articles/10.1186/s13059-019-1854-5 ### ToDo 手法の比較論文では SnapATAC がよいみたいなので、まずは SnapATAC を中心に [2]-[5] の解析ができないか、検討を進めましょう。Loupe cell browser で可視化しているもののほとんどは、同じく R/python script で代替可能と思います。 ### CellRanger 以外のソフトウェア ○[Signac v0.1.5](https://satijalab.org/signac/index.html)
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up