---
tags: materials
---
# Біомашини (завдання)
[Cлайди](https://hackmd.io/@pythondemo-v2/rJB7ufdyO#/15) для вводу в РНК-термінологію.
#### Клітина
{%youtube 7Hk9jct2ozY %}
#### Трансляція
{%youtube WkI_Vbwn14g %}
#### Рибосома
{%youtube Z2XOhgRJVb4 %}
[Ще більше цих неймовірних анімацій!](https://www.youtube.com/watch?v=zlkF2vxzUsw&list=PLD0444BD542B4D7D9&ab_channel=WEHImovies)
- https://en.wikipedia.org/wiki/Palindromic_sequence
- [Теорія РНК світу](https://en.wikipedia.org/wiki/RNA_world)
- [Еволюція 38-6 РНК-полімерази](https://www.pnas.org/content/117/6/2906)
## Обов'язкове
1. Дістати геном [оригінального коронавірусу SARS-nCov-2019](https://www.ncbi.nlm.nih.gov/nuccore/NC_045512.2?report=fasta)
2. Дістати геном мутованого SARS-2 коронавірусу (з 2020 або 2021 року)
- обидва можна знайти тут https://www.ncbi.nlm.nih.gov/nuccore/?term=Severe%20acute%20respiratory%20syndrome%20coronavirus
3. Завантажити їх в пам'ять в Python
4. Порівняти геноми і знайти відстань Левенштейна між ними
5. У файлі з домашньою має бути 4 рядки:
1. Посилання на геном мутованого коронавірусу
2. Дата забору біоматеріалу
3. Відстань Левенштейна відносно оригінального коронавірусу (кількість мутацій)
4. Швидкість мутації коронавірусу (нуклеотидів в місяць)
Хто знайде наймутованіший коронавірус, отримає пірожок.
## Вправи (опціонально)
### З яких звірів з'явився ковід?
В архіві з коронавірусами, окрім ковіду, є ще купа інших коронавірусів, більшість з яких виділено з тварин. Якщо порахувати відстань Левенштейна між ними усіма, які звірі були найбільш ймовірними хостами для оригінального коронавірусу?
Якщо проаналізувати результати порівнянь, які кластери подібності можна виділити?
### Що в них спільне
1. Яка найбільша послідовність нуклеотидів спільна для всіх коронавірусів в архіві?
2. Якщо розглядати не нуклеотиди, а аміноксилоти (тобто, уже після трансляції), то яка найбільша спільна послідовність нуклетидів?
### Найдовша спільна послідовність
Найдовшу спільну послідовність можна використати як "якір", щодо якого можна центрувати 2 геноми при порівнянні. І відповідно, відрізати "хедер" та "футер" геномів, які скоріш за все, рандомні і не грають ролі в біофункції.
Напишіть функцію, яка буде визначати відстань Левенштейна між двома геномами коронавірусу уже після центрування та відрізання незначимих хедера та футера
### Авто порівняння
Напишіть код, який отримує на вхід тільки ID геному з бази https://www.ncbi.nlm.nih.gov/nuccore і повертає кількість мутацій відносно оригінального коронавірусу. Тобто, скачує геном з сайту автоматично і рахує відстань Левенштейна.
### Алерт-бот
Якщо серед нових секвенованих геномів коронавірусу раптом з'являється якась нова мутація більше ніж 2 рази, це може бути поява нового штамму вірусу.
Напишіть телеграм-бота, який буде раз в день перевіряти базу на наявність нових мутацій ковіду і повідомляти кожен раз, коли знаходить **популярну** мутацію.
Раз в тиждень він повинен відсилати статистику, які найпоширеніші мутації ковіду були знайдені за останні 3 місяці.
