16th Workflow Meetup まとめ ========================== 10:00 - 19:00 まで # 全体 - ワークフローライブコーディング(14:00-15:30) - 角崎さん++ - SAPPORO の紹介(15:50-) - すえたけさん++ - CWL Asia TeleConference 17:00- (JST) - 中国のIBMの[IBMSpectrumComputing/cwlexec: A new open source tool to run CWL workflows on LSF](https://github.com/IBMSpectrumComputing/cwlexec) チーム - CWLのマイケルさん - EBIのRob Finnさん ## 次回予定、次次回予定、今後 - 2019-06-28(Fri) - 2019-07-26(Fri) - 2019-08-13(Tue) から 2019-08-16(Fri) ? # 各自 ## 石井 - 次回の日程を決める - ライブワークフローコーディングの司会 - [Singularityが動いているサーバのリスト](https://hackmd.io/PAFOTYGtTQeTi_sqVaKsmw)を集めた - [医科研スパコンTips](https://hackmd.io/VHqqagY9TImpqy7lD3EWKg) ## 藤野 - human-reseq を動かせるように試行錯誤 - 特に picard-SortSam のところでつまづいた - Singularity 上の JVM が SEGV する(ガベコレのメモリが足らない?) 補足: 2.6.1でうごくが2.5.2でうごかない ## 角崎 - 切ったり貼ったりして、既存のワークフローは動かせるようになった気がする。 - ライブコーディングが勉強になった。 - 知らなかったんですが、Dockerってrootless化されたんですね。。 ## 西田 - [dash-bio](https://github.com/plotly/dash-bio) のKEGG活用コンポーネントを作っていました。まだ公開できるレベルに至ってません。次のミートアップで話せるようにします。 - 大田さんのSkype会議からRob Finnさんを知りました。https://github.com/EBI-Metagenomics/kegg-cwl なんてのがあるんだと思いコードを追ってました。 ## 大田 - Sapporo を遺伝研スパコンの個人ゲノム解析環境にデプロイするテストをしていた - データを持ち込むには検閲サーバを経由しなければいけないのでCWLファイルもDockerコンテナも全部手動で入れていく - 頑張って立ち上げたが Web -> Service が繋がらないので困っている => 未解決 ## 新海 - 皆様の話を聞いて勉強しながら自分の仕事やってました… - dockerのセキュリティ問題はいずこでも話題なのだなぁ、などと - 丁度ローカルサーバーのnvidia-docker問題やらジョブ管理等やらで色々やってたので ## 市川 - cwlでbedtoolsを動かしてみた - ファイル名の処理が思うようにいかないので試行錯誤していた 石井補足; いくつかテクニックあるので、Slackで検討しましょう ## 坊農 - 皆さんの話を聴きながら、[ikra](https://github.com/yyoshiaki/ikra/)動かすためのデータをダウンロード、展開などしてた。 - 目標のヒトマウス以外の発現定量ワークフローをどう作成するか、角崎さんのlive codingを見ながら考えたり。 - そろそろちゃんとはじめます… ## 笠原 - [LPM](http://lpm.bio/) の幾つかの既知の問題を解決する方法を調べていた。 - 各種バッチジョブエンジンのオプションの違いを調べようとしたが途中。 ## 池田 - SAPPOROのデモンストレーションを見た - [biocommons/uta](https://github.com/biocommons/uta)のDockerfileと格闘していた ## 末竹 - SAPPORO の紹介をしました ## 八谷 - [ヒトゲノム variant call workflow](https://github.com/ddbj/human-reseq) の更新 - Wiki に DDBJ FTP site の URL を追加 - ライセンスの追加(Apache License 2.0) - First release を作成(v1.0) - ヒトゲノム variant call workflow の再現性を調べている - 環境A(Red Hat Enterprise Linux Server release 7.5)と環境B(Ubuntu 18.04.2 LTS)で同じ入力データ、同じワークフローを実行 - 全ゲノム中約200箇所(〜0.00005%)の variant call 結果が不一致。スレッド並列のせい? 石井補足: bwa-memのところまでは、完全一致している。 > 池田です: Variatnt Callの不一致の話 `-dt NONE` として Down samplingをやめたらどうなるのでしょうか? ## 芳村 - Nextflowパイプラインの修正 - フローチャートの作成(https://www.nextflow.io/docs/latest/tracing.html) ## (自分の名前をふやして、やったことを書いてもらえるとたすかります。)