owned this note
owned this note
Published
Linked with GitHub
第9回、ワークフローミートアップ
==========================
(敬称略)
# やったこと
## 全体
### Azure Batch ハンズオン (西田)
- ドキュメント通りで、だいたいうまくいく
- 一部、GUIの方が操作が簡単そうなので、そちらで作業を行った
- BatchExplorer
- 日本語と、英語でページのレイアウトがちがう。
- `apt` だけのコマンドだと、標準出力に結果がでてくるが、exit コードは、 `1` なので注意すること。
- Azure Batch だと、exit code が `1` だと、 ジョブが失敗したという扱いになる。
### IIBMP 報告(丹生)
- BoFの参加者は、30人くらい
- Galaxyを使ったことがある人は、すくなめだった
- Docker を知っている、使ったことがある人も、ちらほら
- BoFの内容は、技術より方面の話だった。
-
- Rabix Composer が、ちゃんと使えると
- Rabix Composer だけで、ツール定義をかけるので、Galaxy より入りやすいかもしれない
- Planemoがあるとはいえ、Galaxy それなりにしんどいこともある
- 山形には、空港が2つあるので、注意すること
- 山形空港から、鶴岡は大変遠い
- 庄内空港におりることを確認するべき
- 関西から、鶴岡にいくのは大変
# まとめ
## 石井
- handsonで Azure Batch いろいろ試した
- 次回以降の計画
- 国内の、アカデミックなスパコンのリストをあるか探していたところ
- 池田さんより、[Top500 のうち、日本でフィルタしたもの](https://docs.google.com/spreadsheets/d/1xQ5fj8Td_f2Ffl96bd9CF0Zmqf0qFOvJBcWIoqAvvzo/edit#gid=1265964952)をおそわった
## 西田
- azure batch に対する他の人たちの考えがわかった
- 複数のcontainerを用いたtaskの実行がしたい、できるか? > たぶんできそう
- 単純なETL実行系に比べると、たしかに面倒なところがあるのかもしれない。今後papermillとの比較とか考えてみたい。
- batch explorerは「状態の確認」に便利と思う。がコマンドももう少し調べようと思う。
## 丹生
- Azure Batch ハンズオン参加
- ワークフローエンジンのバックエンドとして使えそう?
- IIBMP 2018 での BoF の報告をした
- 以下の条件をすべて満たすと、庄内空港に行くつもりで山形空港に降り立つことができる
- JAL だと庄内空港行きがない
- 山形に空港が2つあることを知らない
- 「東京(羽田) -> 山形」を「東京(羽田) -> 山形(庄内)」に脳内補完できる
- ワークフローエンジンいじり (あまりできず)
- 出力オブジェクトやステージング周りのコードをリファクタリング
- Expression が含まれるテストが失敗する件の調査
- 6, 25, 29, 30, 57, 58, 106, 113
- 最初 YAML パーサのバグを疑ったけどそんなことはなかった
- Expression を含むフィールド末尾の改行の扱いに問題があるっぽい
- JS パーサがメンテ不能(でかすぎ)なのをなんとかしたい
- 現状はほぼフルのパーサを実装して使っている
- cwltool と同様の、カッコの対応関係を確認するのみの実装に変更したい (間に合わず)
- 現状 (Expression 関係の試行錯誤前)
```
99 tests passed, 11 failures, 23 unsupported features
```
- required タグが付いたテストに限った場合
```
38 tests passed, 1 failures, 0 unsupported features
```
- 残り
- JSExpression じゃなくても `$(null)` は解釈できるべき? (required)
- 61
- 落ちろ!([cwl/cwl#761](https://github.com/common-workflow-language/common-workflow-language/issues/761))
- Javascript Expression のパーサのバグ
- 55, 100, 101, 102, 117, 118
- Expression 末尾改行問題
- 57 (修正しようとすると現状 fail が増える)
- Record type 対応 (仕様の理解不足)
- 3, 73
- InitialWorkDirRequirement が input object を書き換える?
- 112
- 現状未サポート扱いの Requirement 対応 (23 unsupported features)
- ScatterFeatureRequirement (18)
- StepInputExpressionRequirement (11)
- SoftwareRequirement (0)
- 挙動に関する仕様がない
- 対応する conformance test がない
- とりあえずスルー
- エンジンは年末 or 年始に一般公開できそう (したい)
## 落合
- hotsubのドキュメント拡充
## 池田
- OS X Mojave のセキュリテーが厳しくなっていて、理研のネットワークに接続する際のPop upによるログインを許可しなくなっていた。
- Azureのハンズオンが大変参考になりました => 西田さんありがとう
- Azureの無料サブスクリプションはSafariではスムーズに実行できた
- ブラウザーベースのターミナルが割と不安定
- Batch Explorerを操作して戻ると、シェルが無反応になり、何度か再起動する必要があった
- 途中で操作についていけなくなった
- Poolの追加のアイコンを見失った...
- ツールの位置に慣れておかないといけないようだ...
- javascript で Python のDictのupdateみたいな事ができことがわかった
- selectDictの内容でmainDisplayComponentsをアップデートした内容を返すと
```javascript
const mainDisplayComponents = {
"#status_response": "none",
"#waiting": "none",
"#analysis_button": "none",
"#result_sheet": "none",
};
let displayManager = selectDict => {
const newStateDict = {...mainDisplayComponents, ...selectDict};
};
```
## 新海
- ハンズオンに参加。ありがとうございます。
- 丹生さんのBoF報告にプラスする形でいくつか補足報告
- TCGAのパイプライン調べたりその他雑用をしたりしてました
- TCGAのパイプライン
- https://docs.gdc.cancer.gov/Data/Bioinformatics_Pipelines/DNA_Seq_Variant_Calling_Pipeline/#data-processing-steps
- BAMで受託
- BAM→FASTQに変換
- Biobambamというツールは初耳
- FASTQ→BAMにBWAでマッピング
- picardでsort&merge
- samtoolsじゃない?
- picardでmark duplicate
- GATKとかで後段処理
- ところで、fusion geneのデータベースってみんなどこを使うとかありますかね?
- TCGAとかcosmicとか引っかかりましたが…。
## 樋口
- Azureの無料サブスクリプションを作成した
- Azureのドキュメンテーションにたどり着けなかった
- 西田さんのスクリーンを見て、作業のトレースを行っていたが途中で見失ってしまった
- あとは、ずっとスクリーンのデモを眺めていた
## 後藤
- Azureの無料サブスクリプション作成していたら、カード番号などを入力後の最終段階で謎のエラー"Bad Request - Request Too Long"が出た
- チャット(英語画面)で質問したら、サポートリクエストが作成された
- しばらくしたら海外(番号通知有りで+91なのでインドと思われる)から電話がかかってきた
- 私の英語力の無さに加えて回線品質も悪いため、会話がほとんど成立しなかった
- メールで返事が来た
- どうやらGoogle Chromeだと必ず"Bad Request - Request Too Long"が出る。
- 同じアカウントでFireFoxでサインインしたら、無料サブスクリプション自体は上手く作成できていた模様。
- これをサポートに英語で説明しないといけないのか。面倒。
- Chromeでは3rd party cookie受け入れを有効に変更しないといけないかも?との指摘あり
## 大田
- ChIP-Atlas (https://chip-atlas.org) のメンテとかをしていた
- 一部環境で繋がるのが非常に遅いという問題がありどうもDNSの問題っぽいのでDNSとロードバランサの設定をしてもらったAWS代理店さんに問い合わせしたりしていた
- CWLのMichaelが12月の第一週に東京に来るのでそのアレンジをしようとおもいます
- CWL-metrics論文最後の詰めが…