# LCMS2 data analysis practice ## Занятие 1 1. Выберем себе для работы спектр https://www.ebi.ac.uk/pride/ скачиваем *.raw 2. Конвертируем mzML https://github.com/compomics/ThermoRawFileParser Параметры для TRFP: ` --input=input-file.raw --output_file=output-file.mzML -f=2 -m=0 -z -L 1,2 -e -l=0 ` 3. Находим какой-нибудь фрагментационный спектр в mzML ` "ms level" 2 ` Запоминаем retention time и precursor m/z. 4. Открываем в batmass 5. **Папки для обмена** * DOWNLOAD: https://kapitul.ru/owncloud/index.php/s/tdT1mZmuWcpA9sk (pass lcms2) * UPLOAD: https://kapitul.ru/owncloud/index.php/s/ltQcmCjArWv0ngV (pass 49a6b660f3f4) ## Занятие 2 1. Изучаем интерфейс batmass. 2D-хроматограмма, масс-спек, выравнивание их друг с другом. 1. Общий вид типичной масс-хроматограммы протеомного анализа. Зона начала, зона данных, зона смыва. Фоновые ионы-контаминанты. 1. Изотопные распределения различных пептид-ионов. 1. Вникание в изотопные распределения. Он-лайн инструменты для анализа: - Брутто-формула для пептида https://www.pep-calc.com/ - Изотопные распределения: https://www.envipat.eawag.ch/ - Точные массы изотопов: https://www.sisweb.com/referenc/source/exactmas.htm 1. События DDA. - Отображение событий - Просмотр масс-спектров фрагментации ## Занятие 3 1. Приготовление target-decoy базы - При помощи R пакета `prozor` ``` requireNamespace('BiocManager') BiocManager::install('prozor') ``` - Пример запуска ``` library(prozor) file.rev <- createDecoyDB("../practice/homosap_rev.fasta", revLab = "rev_", annot = "zz|sourceOf|database") writeFasta(file.rev, file="../practice/db_prozor.fas") ``` 1. Создание базы через философер https://philosopher.nesvilab.org/ ``` mkdir folder cd folder philosopher workspace --init philosopher database --id UP000000216 ``` Список протеомов: https://www.ebi.ac.uk/interpro/proteome/uniprot/#table Если фаста-файл уже готов то ``` philosopher database --add your-fasta-file.fas --contam ``` 1. Comet - download comet: https://github.com/UWPR/Comet/releases/download/v2021.02.0/ - Создание файла параметров: `./comet.exe -p` - У философеровской comet: `philosopher comet --print` - ## Занятие 4 0. Пример запуска TRFP docker ``` #!/bin/bash docker create -v /data/comcon1/TRO-raws/DAAO-TRO:/data_input \ --name=rawparser -it caetera/thermorawfileparser docker start rawparser docker exec rawparser mkdir /data_input/output DOCKRUN="docker exec rawparser mono /home/biodocker/TRFP/ThermoRawFileParser.exe" $DOCKRUN -i=/data_input/20200805_Seva_DAAO_TRO_WT_C1.raw \ -b=/data_input docker exec rawparser mono /home/biodocker/TRFP/ThermoRawFileParser.exe -h docker rm -f rawparser ``` 1. Генерация comet различных аутпутов - `output_percolatorfile = 1` - Получится pin-файл табличного типа. 2. Загрузим pin в jupyter: - ``` pin = pd.read_csv("./bp-k7-1_20211120154542.pin", sep="\t", usecols=range(28) ) ``` - Load histogram ``` h,e = np.histogram(mm['mshift'], bins=np.arange(-0.05,0.05,0.001) ) ``` # Занятие 5 1. Корректировка pin (у кого не выставляются -1): ``` awk ' ($28 ~ /rev_.*/) {a = gensub(/^([^\t]+\t)1/, "\\1-1", "g", $0); print a; } ($28 !~ /rev_.*/) {print $0;} ' bp-k7-1_20211120154542.pin > uu.pin ``` 2. Запуск percolator: - PSMS: no need DB `percolator uu.pin -m uu_psms.pout` Send `uu_psms.pout` to pout2prot to gather protein groups. - PSMS + peptides: `percolator uu.pin -m uu_psms.pout -r uu_peptides.pout` - PSMS + peptides + proteins: ``` percolator uu.pin -m uu_psms.pout \ -r uu_peptides.pout \ -f ../phil/2022-05-16-decoys-contam-UP000005640.fas \ -P rev_ -g -c -l uu_proteins.txt -X uu_proteins.pout ``` 3. Merge PIN and POUT files: ```