# Mac でお気軽に変異抽出アプリ お手元のパソコンを使い変異抽出解析を行いたいとの要望がありましたので、かずさDNA研究所かずさカレー部で Mac 用のアプリを開発いたしました。 特別な知識や難しい操作は不要です。各種ファイルを**ドラッグ&ドロップするだけ**で BAM ファイルから変異を抽出しエクセルファイルを作成することが出来ます。 かずさ遺伝子検査室の二次利用データの解析等にご利用いただけます。 各種データベースのライセンスの問題もあり配布はしておりません。 セットアップサポートのみとなります。 **ご利用をご希望されるかたはかずさカレー部にご入部ください。** --- ## おしらせ 2024/03/25 ToMMo 54kjpn, clinvar_20240317 の導入サポートが可能です。 --- ## 動作環境 MacOS 12, 13 にて動作確認をしています。 Intel/Apple Slicon(M1,M2) ともに動作いたします。 アプリ内で docker を利用して解析ソフトを動かしているため docker のインストールと**アプリ利用中に docker が起動している**必要があります。 --- ## アプリの特徴 1. 比較的簡単なセットアップ 2. ドラッグドロップのみの簡単操作 3. ターゲット領域も指定可能 4. エクセル作成で採用される RefSeq ID も指定可能 * ターゲット領域の初期設定は一般的な Exome 領域となります * 部員から要望のあった免疫不全症遺伝子の領域もご用意しております --- ## セットアップ手順 * docker のインストール https://www.docker.com/ * USB メモリを差す --- ## フォルダの構成 | フォルダ | 内容 | | -------- | -------- | | data | 各種データベース、領域設定ファイルなど | | アプリケーション | 各種アプリケーション | | サンプルデータ | 動作確認用データ|  --- ## アプリの種類と機能 アプリケーションフォルダ内にある全てのアプリはリファレンスゲノムに合わせて hg19、h38 それぞれに用意されています。 アイコンが全部同じかよとのツッコミは禁止とさせていただいております。  #### 単一検体の解析 * hg38.Bam2Vcf ドロップされた BAM ファイルから VCF ファイルを出力します * hg38.Annotate VCF ファイルに情報を追加してエクセルファイルを出力します #### トリオ解析など複数検体の解析 * hg38.Bam2Gvcf ドロップされた BAM ファイルから GVCF ファイルを出力します * hg38.MergeGVCF ドロップされた GVCF(複数可) から VCF ファイルを出力します --- ## 解析手順 まずは docker を起動してください。  起動中は上の用にメニューバー上でアイコンが動いています。 起動中に実行すると動作しませんのでアイコンが止まるまで待ってアプリをご利用ください。 初回起動時に docker がアプリケーションをダウンロードします。 結構時間がかかりますがダウンロードが終わると解析がスタートします。  二次利用の BAM ファイルなどを用意して下記の操作を行ってください。 リファレンスゲノムが hg38 か hg19 かを確認してから操作してください。下の例は hg38 となります。 操作は全てドラッグ&ドロップで、入力ファイルと同じフォルダに出力ファイルが作成されます。 #### 単一検体解析 1. BAM ファイルを hg38.Bam2Vcf にドラッグ&ドロップ 2. 1で出力された VCF を hg38.Annotate にドラッグ&ドロップ 上の操作でエクセルファイルが出力されます。 #### トリオ解析 1. 1検体ずつ BAM ファイルを hg38.Bam2Gvcf にドラッグ&ドロップ 2. 1の操作で作成された3つの GVCF ファイルを hg38.MergeGVCF にドラッグ&ドロップ 3. 2で出力された VCF ファイルを hg38.Annotate にドラッグ&ドロップ 上の操作で3検体の変異を並べたエクセルが出力されます。 --- ## ターゲット領域の指定方法 ターゲット領域の指定は以下の2つの方法があります。 以下の優先順位で領域ファイルを見るようになっています。 1. 入力する BAM と同じフォルダに拡張子を .bed にしたファイル INPUT-FILENAME.bam と同じファイルに INPUT-FILENAME.bed を置く 2. /kazusa/data/hg38/BED/default.hg38.bed 3. default.hg38.bed を削除すると全領域(Wholegenome)となります 検体数が少ない場合や検体毎に異なる領域の変異を抽出する場合は1の方法をご利用ください。 検体毎の bed を指定しない場合は hg38,hg19 それぞれの BED フォルダ内にある default.hg19.bed, default.hg38.bed を参照します。 初期設定は Exome 領域となっています。 免疫不全遺伝子の対象領域の immune.hg38.20bp.bed も用意してありますので、default.hg38.20bp.bed にリネームするかコピーすることで、BED 無指定の際に免疫不全症対象遺伝子の領域を解析するように出来ます。 この default.hg38.20bp.bed は免疫不全症対象遺伝子の CDS 領域を 20bp 広げた領域となります。 hg19 についても同様となります。 --- ## RefSeq ID の指定 エクセルには RefSeq ID が出力されます。 複数の RefSeq ID の候補があった際には一定の条件で順位づけをして1つを選んでいますが、/kazusa/data/RefSeqID.txt に書かれた ID が最優先として選ばれます。 もし期待する ID が選ばれない場合には RefSeqID.txt に ID を追記してください。 初期の RefSeqID.txt には免疫不全症遺伝子で良く使われる RefSeq ID を記載しました。 --- ## USB メモリを使わずに解析する方法 残念ながらインストーラーはありませんので手動でのコピーとなります。 1. デスクトップ上に「kazusa」フォルダを作成 2. USB メモリの「data」フォルダを1で作成したフォルダにコピー 3. USB メモリの「アプリケーション」フォルダをデスクトップなど適当な場所にコピー デスクトップ上の kazusa フォルダが優先的に参照されます。 アプリケーションはどこに置いても大丈夫です。 --- ## サポート インストールサポートを行わせていただいた施設へのみサポートをしております。 その他ではかずさカレー部員へのみのサポートとなります。 --- ## ご意見、ご感想、エラー報告 いつでも遠慮なくかずさカレー部までご連絡ください。 出来る限り柔軟に対応させていただきます。 --- ## Q&A * **動作がおかしいです** 実行時に表示されるウィンドウにエラーが表示されているかもしれませんのでウィンドウのキャプチャ画像をお送りください! * **hg19.Annote、hg38.Annote の出力エクセルに空欄が目立ちます** ゲノムのバージョンをご確認ください。 hg19 で解析されたデータは hg19.Annote を、hg38 は hg38.Annote をご利用ください。 * **No such file or directory とエラー表示がされます** 入力ファイルの置かれているフォルダの名前に半角スペースが入っているとこのエラーとなる場合があります。 お手数ですが上位階層も含めフォルダ名を確認して半角スペースを削除するか _ などに置換してください。 * **動作が怪しく原因不明です** Docker の環境ファイルを全消しすることで改善することがあるようです。 https://zenn.dev/nna1016/articles/f1839a94aad691 --- ## その他 * 再配布は出来ません data フォルダ内には複数のデータベースがありライセンス上再配布は出来ません。 このシステム自体も当研究カレー部によるセットアップ補助により動作するものであり、基本的には利用者によるデータのダウンロードが必要となります。 * USB メモリについて USB メモリを差す際にすでに kazusa の名前のメモリがささっていると正常に動作しません。 事前に kazusa の名前の USB メモリや HDD がないことをご確認してから刺すようにしてください。 * 内部では下記のソフトが動いております。 GATK 4.3.0.0 samtools 1.13 bcftools 1.13 snpEff 5.1d SnpSift 5.1d tabix 1.13 OpenJDK 11.0.17 アノテーション付き VCF からエクセルのベース作成はオリジナルの perl スクリプトとなります。 * 参照データベースについて ExAC Release 1 gnomAD 3.1 dbsnp 151 ToMMo 8.3k jpn clinvar 20220723 * 各種データベースの更新について データベースの更新についてはかずさカレー部までご連絡ください。
×
Sign in
Email
Password
Forgot password
or
By clicking below, you agree to our
terms of service
.
Sign in via Facebook
Sign in via Twitter
Sign in via GitHub
Sign in via Dropbox
Sign in with Wallet
Wallet (
)
Connect another wallet
New to HackMD?
Sign up