# LCMS2 data analysis practice
## Занятие 1
1. Выберем себе для работы спектр
https://www.ebi.ac.uk/pride/
скачиваем *.raw
2. Конвертируем mzML
https://github.com/compomics/ThermoRawFileParser
Параметры для TRFP:
`
--input=input-file.raw --output_file=output-file.mzML -f=2 -m=0 -z -L 1,2 -e -l=0
`
3. Находим какой-нибудь фрагментационный спектр в mzML
`
"ms level" 2
`
Запоминаем retention time и precursor m/z.
4. Открываем в batmass
5. **Папки для обмена**
* DOWNLOAD: https://kapitul.ru/owncloud/index.php/s/tdT1mZmuWcpA9sk
(pass lcms2)
* UPLOAD: https://kapitul.ru/owncloud/index.php/s/ltQcmCjArWv0ngV
(pass 49a6b660f3f4)
## Занятие 2
1. Изучаем интерфейс batmass. 2D-хроматограмма, масс-спек, выравнивание их друг с другом.
1. Общий вид типичной масс-хроматограммы протеомного анализа. Зона начала, зона данных, зона смыва. Фоновые ионы-контаминанты.
1. Изотопные распределения различных пептид-ионов.
1. Вникание в изотопные распределения. Он-лайн инструменты для анализа:
- Брутто-формула для пептида https://www.pep-calc.com/
- Изотопные распределения: https://www.envipat.eawag.ch/
- Точные массы изотопов: https://www.sisweb.com/referenc/source/exactmas.htm
1. События DDA.
- Отображение событий
- Просмотр масс-спектров фрагментации
## Занятие 3
1. Приготовление target-decoy базы
- При помощи R пакета `prozor`
```
requireNamespace('BiocManager')
BiocManager::install('prozor')
```
- Пример запуска
```
library(prozor)
file.rev <- createDecoyDB("../practice/homosap_rev.fasta", revLab = "rev_", annot = "zz|sourceOf|database")
writeFasta(file.rev, file="../practice/db_prozor.fas")
```
1. Создание базы через философер https://philosopher.nesvilab.org/
```
mkdir folder
cd folder
philosopher workspace --init
philosopher database --id UP000000216
```
Список протеомов: https://www.ebi.ac.uk/interpro/proteome/uniprot/#table
Если фаста-файл уже готов то
```
philosopher database --add your-fasta-file.fas --contam
```
1. Comet
- download comet: https://github.com/UWPR/Comet/releases/download/v2021.02.0/
- Создание файла параметров: `./comet.exe -p`
- У философеровской comet: `philosopher comet --print`
-
## Занятие 4
0. Пример запуска TRFP docker
```
#!/bin/bash
docker create -v /data/comcon1/TRO-raws/DAAO-TRO:/data_input \
--name=rawparser -it caetera/thermorawfileparser
docker start rawparser
docker exec rawparser mkdir /data_input/output
DOCKRUN="docker exec rawparser mono /home/biodocker/TRFP/ThermoRawFileParser.exe"
$DOCKRUN -i=/data_input/20200805_Seva_DAAO_TRO_WT_C1.raw \
-b=/data_input
docker exec rawparser mono /home/biodocker/TRFP/ThermoRawFileParser.exe -h
docker rm -f rawparser
```
1. Генерация comet различных аутпутов
- `output_percolatorfile = 1`
- Получится pin-файл табличного типа.
2. Загрузим pin в jupyter:
-
```
pin = pd.read_csv("./bp-k7-1_20211120154542.pin",
sep="\t", usecols=range(28) )
```
- Load histogram
```
h,e = np.histogram(mm['mshift'], bins=np.arange(-0.05,0.05,0.001) )
```
# Занятие 5
1. Корректировка pin (у кого не выставляются -1):
```
awk '
($28 ~ /rev_.*/) {a = gensub(/^([^\t]+\t)1/, "\\1-1", "g", $0); print a; }
($28 !~ /rev_.*/) {print $0;}
' bp-k7-1_20211120154542.pin > uu.pin
```
2. Запуск percolator:
- PSMS: no need DB
`percolator uu.pin -m uu_psms.pout`
Send `uu_psms.pout` to pout2prot to gather protein groups.
- PSMS + peptides:
`percolator uu.pin -m uu_psms.pout -r uu_peptides.pout`
- PSMS + peptides + proteins:
```
percolator uu.pin -m uu_psms.pout \
-r uu_peptides.pout \
-f ../phil/2022-05-16-decoys-contam-UP000005640.fas \
-P rev_ -g -c -l uu_proteins.txt -X uu_proteins.pout
```
3. Merge PIN and POUT files:
```