--- tags: materials --- # Біомашини (завдання) [Cлайди](https://hackmd.io/@pythondemo-v2/rJB7ufdyO#/15) для вводу в РНК-термінологію. #### Клітина {%youtube 7Hk9jct2ozY %} #### Трансляція {%youtube WkI_Vbwn14g %} #### Рибосома {%youtube Z2XOhgRJVb4 %} [Ще більше цих неймовірних анімацій!](https://www.youtube.com/watch?v=zlkF2vxzUsw&list=PLD0444BD542B4D7D9&ab_channel=WEHImovies) - https://en.wikipedia.org/wiki/Palindromic_sequence - [Теорія РНК світу](https://en.wikipedia.org/wiki/RNA_world) - [Еволюція 38-6 РНК-полімерази](https://www.pnas.org/content/117/6/2906) ## Обов'язкове 1. Дістати геном [оригінального коронавірусу SARS-nCov-2019](https://www.ncbi.nlm.nih.gov/nuccore/NC_045512.2?report=fasta) 2. Дістати геном мутованого SARS-2 коронавірусу (з 2020 або 2021 року) - обидва можна знайти тут https://www.ncbi.nlm.nih.gov/nuccore/?term=Severe%20acute%20respiratory%20syndrome%20coronavirus 3. Завантажити їх в пам'ять в Python 4. Порівняти геноми і знайти відстань Левенштейна між ними 5. У файлі з домашньою має бути 4 рядки: 1. Посилання на геном мутованого коронавірусу 2. Дата забору біоматеріалу 3. Відстань Левенштейна відносно оригінального коронавірусу (кількість мутацій) 4. Швидкість мутації коронавірусу (нуклеотидів в місяць) Хто знайде наймутованіший коронавірус, отримає пірожок. ## Вправи (опціонально) ### З яких звірів з'явився ковід? В архіві з коронавірусами, окрім ковіду, є ще купа інших коронавірусів, більшість з яких виділено з тварин. Якщо порахувати відстань Левенштейна між ними усіма, які звірі були найбільш ймовірними хостами для оригінального коронавірусу? Якщо проаналізувати результати порівнянь, які кластери подібності можна виділити? ### Що в них спільне 1. Яка найбільша послідовність нуклеотидів спільна для всіх коронавірусів в архіві? 2. Якщо розглядати не нуклеотиди, а аміноксилоти (тобто, уже після трансляції), то яка найбільша спільна послідовність нуклетидів? ### Найдовша спільна послідовність Найдовшу спільну послідовність можна використати як "якір", щодо якого можна центрувати 2 геноми при порівнянні. І відповідно, відрізати "хедер" та "футер" геномів, які скоріш за все, рандомні і не грають ролі в біофункції. Напишіть функцію, яка буде визначати відстань Левенштейна між двома геномами коронавірусу уже після центрування та відрізання незначимих хедера та футера ### Авто порівняння Напишіть код, який отримує на вхід тільки ID геному з бази https://www.ncbi.nlm.nih.gov/nuccore і повертає кількість мутацій відносно оригінального коронавірусу. Тобто, скачує геном з сайту автоматично і рахує відстань Левенштейна. ### Алерт-бот Якщо серед нових секвенованих геномів коронавірусу раптом з'являється якась нова мутація більше ніж 2 рази, це може бути поява нового штамму вірусу. Напишіть телеграм-бота, який буде раз в день перевіряти базу на наявність нових мутацій ковіду і повідомляти кожен раз, коли знаходить **популярну** мутацію. Раз в тиждень він повинен відсилати статистику, які найпоширеніші мутації ковіду були знайдені за останні 3 місяці. ![](https://i.imgur.com/fI8YJ73.png)