Clara Discovery 是 NVIDIA Clara Train 4.0 所新增的項目,忘記誰跟我說它是藥物製造,或許是 google translate (!?),但 Clara Discovery 其實並不涉及製造,而是用在藥物設計。
不過這一篇網誌有點太長了,所以內文被我拆成上下篇,分別討論藥物設計與 Toolkits。
在 Clara Train 4.0 推出的新功能中,Clara Discovery 因受肺炎疫苗開發的影響尤為引人注目。它可透過預先訓練過的 AI 模型與 GPU 算力的提升與優化,用以加速新藥研究流程,並幫助製藥者改善分析、效率和擴充能力,使之能更有效地在龐大的分子資料庫中搜尋探索、縮短病毒分析所需時間,以及用物理學及 AI 來模擬分子與人體的生物化學反應,找出並最佳且最有可能用於治療的化合物,以達到降低成本與失敗率的目的。
根據過往資料可以發現,新藥研發痛點大多脫離不了時間、成本和失敗率三點,根據資料顯示:
因此為降低失敗率,並加快藥物設計,Clara Discovery 集合了相關框架、應用程式和預訓練模型,並借助 GPU 加速,以縮減蛋白質分析、搜尋候選分子所需時間,並且透過模擬、比對…等方式確認藥物成效。
相較傳統的設計與篩選需要費時 4~5 年的時間,才能夠進入人體臨床試驗階段,而 AI 分析技術能將時程縮短至 1 年以內,讓救命的藥物能更快進入臨床使用。
目前 Clara Discovery 應用中包含了些常用工具、加速處理的方法與新開發的工具,例如:Parabricks、BioMegatron、RAPIDS、MegaMolBART、AutoDock 與 GROMACS…等。而這些工具將應用於研發各階段,如:蛋白質體學、顯微鏡學、虛擬篩選、計算化學、可視化、臨床成像和自然語言處理…等多個領域。
下圖是 NVIDIA 所繪製的理想流程圖,他們運用了目前手邊的武器庫兜出了個漂亮的流程圖。
呃…我用了「兜」這個字是因為在 Survey 的過程中,我所了解到的步驟與他們畫出了流程圖有些出入,但造成這落差的原因有可能是因為實務操作、研究方向、各領域進行客製化,甚至是個人習慣所導致。所以我先認定 NVIDIA 繪製的是一個概括的流程圖,至於詳細的流程與 Toolkits 的介紹我們後面章節再說。
流程圖中讓我覺得比較突兀的是 IMAGING
與最後的 NLP
。IMAGING
或許還可以解釋為臨床實驗的效果確認,但…好像不是所有的結果都可以透過醫療影像可以判別的!?而 NLP
那塊我真的覺得是為了流程而放進去的(不負責任猜測 🤣 XD)
是說…這張流程圖畫重點,等等應該會很常看到它。
在開始前,先來補充點先備知識,包含一些等等可能會反覆出現的專有名詞或觀念。先列一些出來,如果有沒提到的,再問我嘿~
受體(receptor)
又稱受器、接收器,是一個生物化學上的概念,習慣上所說的靶點。
指一類能傳導細胞外訊號,並在細胞內產生特定效應的分子。產生的效應可能僅在短時間內持續,比如改變細胞的代謝或者細胞的運動;也可能是長效的效應,比如上調或下調某些基因的表達。
受體通常是一種蛋白質分子,通常存在酵素分子的表面,可以和神經傳導物質、荷爾蒙、藥物或是毒物等配體結合。每種受體只能結合某些特定形狀的配體分子,受體在與配體結合之後,會帶來構型(conformation,受體蛋白質的三維結構)的改變,因而影響蛋白質活動,並進一步引起各種細胞反應。
這個字的翻譯我總共看到了 3 種構型、構形與構象,最後我根據研究院的雙語辭書中藥學的學術名詞選用了構型這個字。
配體(ligand)
在這篇中我們可以直接理解成藥物分子。
在生物化學和藥理學中,配體是指一種能與受體結合以產生某種生理效果的物質。在蛋白質-配體複合物中,配體通常是與靶點蛋白特定結合位點相連的訊號觸發分子。
靶點
這邊說的是藥物靶點,指藥物在體內的作用結合位點,也就是藥物分子的作用目標,包括基因位點、受體、酶、離子通道、核酸等生物大分子。
藥物作用
在人體內,受體與配體結合,並引起一系列生物功能變化的過程。
活性化合物(hit compound)
活性化合物對不同研究人員的含義可能不同。這邊簡單理解成,粗選出來準備進行篩選的化合物。
先導化合物(lead compound)
從活性化物中篩選或擴展出來的第二階段化合物。
是一種具有藥理學或生物學活性的化合物,可被用於開發新藥,但存在某些缺陷,如活性不夠高、化學結構不穩定、毒性較大、選擇性不好、藥物動力學性質不合理或其他脫靶效應,這些化合物往往還無法作為理想藥物,需要進行化學優化,將藥性提高至足以進行生物試驗或臨床試驗的程度。
候選藥物(candidate)
先導化合物通常需再合成千百個衍生物,評估並比較其活性、毒性、安定性、藥物動力學後,選上數個具有潛力者的候選藥物(candidate)進入下一階段之臨床前試驗。
化合物與藥物開發階段對應關係如下
本節開始前,可以先去看看這支 Overview 的影片–《Drug discovery and development process》,它簡單敘述了個完整的藥物設計與研發流程,雖然看到最後才發現它是某間公司的廣告 XDDD
關於 Drug Design 這個字我找到的翻譯是藥物設計,根據維基百科的定義這是一個根據靶點尋找與發明藥物的過程;按我自己的話來說,它是從找靶點到找到候選藥物(candidate)的過程。
如要詳細描述藥物設計的流程,它是根據靶點的三維結構,測定或計算受體與配體的作用模型,並依據化學結構、電價與形狀等,設計出可能達到效果的新型化學藥物。除了考慮藥物與受體的結構特點外,還需要考慮藥物的毒性、吸收、分布、排除、代謝過程等因素的影響。
若想深入了解藥物設計,可以看看 Gerhard Klebe 著作的《藥物設計:方法、概念和作用模式》。這我有找到簡中譯本,算是一本教科書等級的書籍,光看製藥公司親自來翻譯這本書,就可以看出它的專業性,我都懷疑這本書是他們公司新訓員工的教材,這麼想想那些新員工好像有點慘(!?)
不過這本書真的寫得太專業的,我大概從高中畢業後就再也沒有看過任何的化學式,所以我自己也沒把這 700 多頁看完,就把它當辭典跳著看。但也能讓初學者大致理解了藥物設計與 Clara Discovery 提供的工具使用情境與流程,還多了奇奇怪怪的化學知識。
會有這個章節,純粹是因為一開始我使用 Drug Discovery 來 Survey 相關資料時,發現資料寥寥無幾。但反之,當我用 Drug Design 來找搜尋時,資料反而不計其數。喔對,特指中文資料。
所以我就有點好奇啦,Drug Discovery 與 Drug Design 在定義上是否有所差異。
在看 Drug Discovery 的定義前,先看看另外一個字 – Drug Development。這個字的中文翻譯是藥物研發,它的定義是比較明確的,就是從候選藥物到上市這段時間。
我發現有人直譯成藥物發現,在網路上針對這個字的定義較模稜兩可,我看到幾種關於 Drug Discovery 這個字的定義:
Drug Design 的前導步驟:
根據《Difference between Drug Design and Drug Development》 一文中所提到的:
Generally, a drug is available in the market by passing through 3 stages:
Drug Discovery >>> Drug Design >>>Drug Development
這裡的解釋將 Drug Discovery 視為 Drug Design 的前導步驟,但在文中它並沒有確切定義所謂的前導步驟,所以我自己推測可能是藥物選擇與結構推定(尤藥物反推可以治癒的疾病的開發過程中會需要)之類的步驟。
我只在《Drug Design and Discovery: Principles and Applications》找到了個可能類似的定義:
Drug discovery is the process through which potential new therapeutic entities are identified, using a combination of computational, experimental, translational, and clinical models Despite advances in biotechnology and understanding of biological systems, drug discovery is still a lengthy, costly, difficult, and inefficient process with a high attrition rate of new therapeutic discovery. Drug design is the inventive process of finding new medications based on the knowledge of a biological target.
他們說 Drug Discovery 是識別潛在新治療實體的過程(?)。這句話有點難懂,難道是先找目標疾病或基因嗎?不過在這篇文章中很明顯可以看出,Drug Discovery 與 Design 是兩個相異的動作。
與 Drug Design 同義
根據維基百科的定義,這也是我在找資料的時,最常看到的解釋:
Drug discovery is the process by which new candidate medications are discovered.
在多數文章中會把 Discovery 與 Design 並用或連用,從上下文中看來它們兩多是等義的存在。
其他,如《The Stages of Drug Discovery and Development Process》一文、GTC 2022 《AI FOR BIOLOGY:PROTEIN STRUCTURE PREDICTION AND BEYOND》演講中,都用了採用了類似的定義。
藥物設計與研發完整流程
單看 Clara Discovery Flow,我覺得上面兩種都不太符合 NVIDIA 的定義。
從流程圖看來它比像是 Drug Design 與部分 Development 的整合,因為圖中一路從基因定序包到臨床試驗及之後的病例回饋,但又少了人體試驗到上市之後(或許有,IMAGING
擴大解釋能可以視為藥物上市後的投藥情況,但沒有明說)。
所以嚴格說來藥物設計的相關應用才是這是新增的主要內容,但它跟舊有的基因定序、醫療影像、自然語言處理…等應用,行成了最後推出的 Clara Discovery Flow。
會特別想提到藥物設計,是因為在藥物設計中有一子領域,不同於傳統藥物開發從茫茫化合物海中撈出適合的潛力藥物,它是藉由電腦模擬和計算受體與配體的相互作用,進行先導化合物的最佳化與設計。
電腦輔助藥物設計這子領域認真要探討是一個非常龐大的論題,可以涉及到結構化學、藥物化學、分子藥理學、生物化學、結構生物學、分子生物學、化學生物學、細胞生物學、生理學、病理學、生物物理學、組合化學、量子化學、分子力學、分子動力學、分子圖形學、計算化學、化學資訊學、生物資訊學、X-ray 晶體學、核磁共振技術、電腦圖形技術、資料庫技術和人工智慧技術等基礎學科和應用學科與技術。
…上面那串我就是列出來嚇人的 XDDD。上述算是電腦輔助藥物設計的基礎學科知識與技術,除非要深入研究或專門領域人員,不然應該不會碰到那麼多的技術。
有沒有覺得這些解釋跟知識技術與 Clara Discovery 在做的事情超像有沒有!?因為從簡單定義來看,電腦輔助藥物設計就是使用電腦分子建構技術,來進行藥物設計,而 Clara Discovery 可以被歸入這個範疇。
從廣義定義來說,電腦輔助藥物設計泛指資訊技術在藥物設計與研發過程中的所有應用,包含分析技術、處理過程…等;但狹義上,也是通常意義上的電腦輔助藥物設計僅指基於分子模擬的設計技術,從電腦運算模擬篩選出活性化合物,進一步能用於結構修飾的先導化合物的開發,大幅降低後續試驗規模與成本,並加速藥物開發。
將上述狹義的電腦輔助藥物設計與 Clara Discovery Flow 相對應,也就是流程圖中的橘色虛線框區域。至於廣義的部分我就不畫了,整個 Flow 算進廣義電腦輔助藥物設計應該沒問題?
既然都提到 Clara Discovery Flow,那就來看看整體新藥設計的流程,並將該流程與 Clara Discovery Flow 相互對照吧!
製藥、製藥,但藥物本身也有不同的分類,對於不同分類的藥物其設計法大相徑庭。在生技醫藥產業中將藥物依照分子量大小區分為:
小分子藥物(small molecule)
一般為化學藥,此類藥物大部分是由化學合成製造且分子量小於 1000 道爾頓(dalton,Da) 的化合物(1 道爾頓等於一個氫原子的重量)。另外,有些資料會將分子量上限設在 900 道爾頓,因為 900 道爾頓以下的分子在人體內能較快速地擴散進入細胞。
常見的阿斯匹靈就是一種化學藥,它有 21 個原子 180 道爾頓,因此屬於小分子藥。
大分子藥物(large molecule)
一般為生物藥,具有較大且複雜的分子,並由生物技術製造而成,在動植物或微生物體內形成。
常見用於改善生長遲緩的生長激素與單株抗體,它們分別由 3000 與 25000 個原子組所組成,都屬大分子藥物。
Clara Discovery 主攻的就是小分子藥物製藥,它會著眼於分析受體與配體的三維結構模型,並利用統計學建模工具或者虛擬篩選的方法確定新的分子實體。
對於小分子藥物設計,按照著眼點的不同,有 3 種常見開發法:
基於結構的藥物設計(Structure-based drug design, SBDD)
從受體的結構和性質出發尋找可以與其特異結合的配體分子,所以也稱為直接藥物設計,包括基於受體結構的分子嵌合(Docking)、活性位點分析、從頭藥物設計(在通過分子生成的方法,生成具有特定性質的全新分子以探索化學空間,補充化合物資料庫的方法)…等。
這種設計方式顧名思義就是仰賴結構資訊,需要有化合物與目標蛋白配受體兩方的結構,將其逐一嵌合,考慮彼此的物化特性、計算兩者之間的各種分子作用力,綜合評比找出較能與受體穩定結合的活性化合物,爾後反覆進行結構修飾與嵌合,設計出先導化合物。
NVIDIA 的 Clara Discovery 看來是採用此藥物設計法來開發的。
基於配體的藥物設計(Ligand-based drug design, LBDD)
根據已知活性的先導化合物,構建結構-活性關係或藥效基團模型,稱為間接藥物設計,包括定量構效關係(Quantative Atructure-activity Relationship, QSAR)、藥效基團模型、受體映射、基於分子形狀的疊合…等方法。
此方法適用於結構或結合區域未知的目標蛋白,但這需要知道不同化合物對該蛋白的抑制能力與活性的關係,以建立構效關係,進而找出活性化合物,再優化其結構與代謝特性,成為先導化合物。
基於片段的藥物設計(Fragment-based drug design, FBDD)
這個算是比較特別的開發方式,不同於基於結構的藥物設計法主要通過從天然或已知化合物中隨機篩選來發現新藥。在一個藥物分子結構中,每個組成片段都發揮著不同的作用,這種開發法,主要利用現有的藥物分子片段,將不同的結構片段進行組合或者延伸,以期發現先導化合物。
會提到這個,是因為在 GTC 2022 中,清大楊教授所介紹的《First-principle-based and Data-driven Drug Design Platform Using a Multi-site Targeting Strategy》的藥物設計應該就是這個方向。
林榮信研究員將現代的藥物設計流程,簡敘述為以下步驟:
接下來,我試圖將此藥物設計流程與 Clara Discovery Flow 相對應。
主要對應 Flow 中的
GENOMICS
區塊。
針對受體進行次世代基因定序,得出其基因序列,並期望從中發現關鍵的藥物作用靶點。選擇並確定新穎(?)的有效靶點是藥物設計的首要任務與核心,可以說靶點的選取會直接決定了藥物開發的成敗。曾有看過某阿茲海默症藥物設計開發過程,雖耗時 8 年開發,但最後以失敗告終,溯其原因就是錯誤靶點的選取。
以設計醫治病毒的藥物為例,靶點的目的是讓藥物干擾病毒複製過程的某個階段,以穩定且有效地壓制病毒。有點類似在生產線上卡關的概念,我們用藥物抑制細胞生產特定蛋白質,就像抽走流水線上的一個零件,最終讓產線無法合成病毒;又或者是我們使用要藥物誘導細胞生產另一相似結構的蛋白質,就像是生產了不合規格的零件,產線雖可以合成病毒,但還是因次級零件的使用導致最終成品無法發揮其作用。
關於靶點選擇與確認的方法,並不是我這次主要的 Survey 目標,所以我就先不細究了。
主要對應 Flow 中的
STRUCTURE
區塊。
在藥物化學中,有個還滿有名個概念,至少最近在啃相關資料時看過不只一次了:「如果你要了解某個功能,那麼你首先要了解它的結構」,算是知彼知己,百戰不殆嗎?
解出分子結構的學科或工具相當的多樣,如:
X-ray 晶體學
它可由電子密度圖可以推測出分子高解析度的三維結構。
但既然是晶體學,待測物就必須是結晶狀才有辦法應用該技術,如病毒這種不會長成晶體的就不適合使用該方法。即便待測物能產生結晶,很多蛋白質只能在特定的酸鹼和溫度下才會產生結晶,若想要觀察蛋白質在不同環境下的結構變化,會不得其門而入。
核磁共振光譜學
這方法可以獲得高解析度的三維結構,它是利用磁場與待測物原子核進行共振,解讀釋放後電磁波訊號,反推原子核在待測物的數量與分布。但這項技術的限制是待測物的分子量必須小於 35000 mol。
冷凍電子顯微術
這方法對待測物的限制物較小,不需要形成結晶,因此可以觀測較多樣的環境。但在某篇文章中提到冷凍電子顯微術是三者中精確度較低的,關於這點我需要再查查資料。
另一個得到獲得蛋白質結構的方式是透過蛋白質結構資料庫,但這些資料庫雖有提供分子結構,實質上這些結構仍只是模型。在現實中蛋白質是動態的,每個原子的 X, Y, Z 位置都會隨著時間與環境而變動並非一成不變的,因此需具備結構生物學知識,來理解蛋白質結構資料庫中「分子結構」的真實意義。
除傳統觀測方法外,還有 DeepMind 的 AlphaFold 與華盛頓大學 Baker 團隊的 RoseTTAFold,兩種用方法可以透過一維胺基酸序列直接預測出三維蛋白質結構,此外也能加速分析由實驗上取得的結構資訊。
雖然 NVIDIA 的 Clara Discovery Toolkits 中有提供電子顯微鏡的影像處理軟體的工具,不過就 Flow 的角度,它可能會是主推用 RoseTTAFold?不然 Flow 中的 GENOMICS
與 STRUCTURE
不一定得相接,還能順便賣賣 GPU。
主要對應 Flow 中的
SEARCH
+DOCKING
+SIMULATION
區塊。
此步驟主要利用電腦模擬藥物開發所選定的靶點,來快速篩選出有機會的先導化合物,高精度計算兩者相遇後會如何作用與運動。
這麼一段話其實可以分成 3~4 個動作:
選定的靶點
其實這個動作應該算是前兩步驟的整合。舉例來說,涉及基因的疾病,可能在 GENOMICS
時分析出變異點,然後在 STRUCTURE
找出變異點在三維結構的位置,最終得到一個靶點,這算是我們 Step3 的 input 吧。
篩出先導化合物
在這邊不得不提到化合物篩選的幾個階段 Hit-Lead-Candidate:
活性化合物的篩選
在這階段又被稱為 Target to Hit,個人認為這個步驟應該對應到 Flow 中的 SEARCH
。
這邊會自動化的初步篩選出一批化合物,通常由機器完成,通常可能會篩選出 20 萬到超過 100 萬種化合物,這些對靶點有作用的化合物會被標為 hits。
這批化合物,會對特定標點具有初步活性。而篩選途徑主要是隨機篩選(如:高通量篩選 High throughput screening,HTS)或是基於受體結構來找分子…等。取得一個活性化合物後可以再由其衍生出來的一系列化合物的集合。
是說,在部分資料會看到有人用苗頭化合物這個詞,這個應該是中國用詞,兩個是同義詞。
先導化合物的發現
這階段有個專有名詞稱之為 Hit to Lead。
一旦獲得大量的活性化合物後,團隊會從中篩選出約 100 種活性好的化合物,作為先導化合物用於繼續深入研究。此時的化合物已經具備一定藥理學或生物學活性,但仍存在某些缺陷,而無法作為理想藥物,需要進行化學優化,將藥性與副作用優化至足以進行試驗的程度。
這個步驟應該對應到 Flow 中的 DOCKING
。
候選藥物的選定
在該階段,也稱為先導化合物最佳化 Lead Optimization。這時通過詳細的生物測試來進一步指導先導化合物的優化,最後得到 1~2 種候選化合物,進行臨床試驗。
不過這個小標超出範圍了,所以這個步驟與 Flow 對應等等我們下一個項目聊。
高精度計算兩者相遇後會如何作用與運動
這句話我們可以跟剛剛候選藥物的選定一起看,對應的是 Flow 中的 SIMULATION
。
SIMULATION
這區塊的主要行為是進行分子動力學模擬(Molecular Dynamics Simulation, MD),它會計算受配體在相遇後會如何作用與運動,主要模擬蛋白質動態資訊,並透過進階的生物物理實驗,如:37 度、120~150 摩爾濃度、PH=7,確認生存條件是否符合人體條件,並間接驗證所得到的動態訊息,例如:帶有時間解析度的 X-ray 晶體學、甚至是自由電子雷射。
這些操作會有助於優化受體和配體的相互作用,達到活性最佳化,所以我看到有人將分子動力學模擬視為候選藥物選定操作的一部分,但我總感覺 Hit to Lead 和 Lead Optimization 的分界並不是那麼壁壘分明。
就目前我所知的習慣上分子嵌合與分子動力學模擬會連續操作。兩者主要都是對活性進行確認,但差別在蛋白質動態資訊,蛋白質中的每個原子位置都會隨著時間與環境而變動,這點是分子嵌合所無法模擬的。
而為了彌補蛋白質動態資訊的缺失,或是當無法從 X-ray 或公開資料集取得不同構型時,部分研究中這兩個動作會形成一個迴圈,先做分子動力學模擬,取得不同的初始結構,再進行分子嵌合挑選活性,最後再做一次分子動力學模擬進行活性最佳化,前面提過的清大楊教授就是這麼做的。
所以說 SIMULATION
算是 Lead Optimization 的一部分嗎?雖然有點曖昧不清,但以讓先導化合物更安全更有效的角度出發,我認為它可以算是最佳化的一環。但 SIMULATION
完後的結果就是候選藥物了嗎?應該還不是。
從我的理解,此時的化合物只能算是經過最佳化的先導化合物,還達不到能被稱之候選藥物程度,中間可能要再經過毒性及代謝的測試…等實驗,才能放入下一步臨床階段,而不是像流程圖中直接接入臨床,中間可能省掉了些操作。這也是我先前認定 NVIDIA 繪製的是一個概括的流程圖的主要原因。
都提到先導化合物最佳化,就不得不提提 NVIDIA 在 Clara Discovery 主打的一個 Toolkit – MegaMolBart。
雖然這一工具並不在他們的流程圖上,但在宣傳影片中提到可以用來做先導化合物最佳化,因此我猜測是放置在 DOCKING
跟 SIMULATION
中間,它會將 DOCKING
的結果做化學式的最佳化,再送入 SIMULATION
複測活性。從臉書上的貼文看來,我的猜測應該也是合理。
一般來說 Hit-Lead-Candidate 的過程曠日彌久,很難通過一次循環(SEARCH
→ DOCKING
→ SIMULATION
)就可以找到候選藥物,通常需 10~15 次的嘗試才有可能找到最為合適的分子。
呃…這邊又蹦出一個專有名詞 - 虛擬篩選…嗚…我等等再開一個小節來介紹好了,不然這一小節比重完全失衡了。
部分對應 Flow 中的
IMAGING
區塊。
又可以分成臨床前試驗與臨床試驗兩個階段:
臨床前試驗(Pre-clinical tests)
顧名思義,在藥物應用於人體之前的試驗。會用動物對先導化合物進行安全性評估,其目的在於了解藥物的療效、潛在副作用和臨床安全劑量,這通常又要花費 1.5~3 年左右的時間。
詳細來說,就是了解該藥物被活體吸收之後,在體內如何吸收、分布、代謝和排泄,以及是否能達到期望的效果與是否會產生毒性、致突變性及致癌性…等。具體涉及藥物效應動力學(Pharmacodynamics, PD)、藥物代謝動力學(Pharmacokinetics, PK)跟與疾病動物模型的有效性評估…等學科知識,這邊就略過不表。
有沒有發現這邊用的是先導化合物?就敘述來看,先導化合物最佳化和臨床前實驗在時間上是並行,他們可能得出化合物後,接著進行實驗找出缺陷,再重新進行最佳化或是找尋其他化合物。
這一階段對應到流程圖中,應該位於 SIMULATION
與 IMAGING
中間,因為圖中 IMAGING
的輸入已經候選藥物。不過 IMAGING
也可用來觀察動物實驗中與醫療影像相關的變化,就是模型可能要重新訓練?
臨床試驗(Clinical trial)
這一階段主要是評估藥物對人體療效的方式,通常要花費 5~7 年左右的時間。
臨床前試驗通過後,必須向主管機關通過試驗用新藥(investigational new drug, IND)的審核,且取得人體試驗倫理委員會(Institutional Review Board, IRB)的同意,在經核可的醫學中心或醫院進行。
新藥的臨床試驗通常分成四期,但在進行第四期前需先申請新藥查驗登記(New drug application, NDA)。
臨床一期
此階段研究通常採用 20~50 位健康志願者為測試對象,並無治療性目的,主要目的為測試新藥的安全性、毒性,以了解試驗藥物的最大可能、安全與治療…等劑量及給藥時程。
臨床二期
此階段通常會有 50~300 位病患,是探討不同劑量或治療方法對病患的安全性與有效性,並評估其對人體的影響。
臨床三期
此階段會確認臨床二期中試驗藥物的安全性與有效性,並進行更進一步地評估。這會以 250~1000 位病患為試驗對象,將試驗藥物與目前的標準療法作比較。參與者會被分成對照/試驗組兩組,試驗組給予試驗藥物,而對照組可能服用已上市之藥物或是安慰劑作比較。試驗時會依雙盲(double blind)準則進行試驗,並確保試驗結果不會受到人為選擇或其他因素的影響。
此階段主要目的為,判斷試驗藥物是否優於或不亞於標準療法,並為向藥品管理機構申請新藥查驗登記(NDA)做準備。
臨床四期
亦名上市後臨床試驗監視期,作長期使用是否會產生慢性副作用、發生率極低之不良反應或嚴重副作用的追蹤與評估。
這章算是不小心開出來的支線任務 XDDD 內容主要是針對前面所提到的一些專有名詞做出補充說明。
分子模擬是運用力學理論與電腦計算,來構築分子結構與行為,進而模擬各種物理、化學性質與分子間及分子內的交互作用,以探討系統微觀結構與能量的關係。還可模擬定溫、定壓…等實驗條件,從分子角度闡釋其運動行為,甚至做出預測。除了模擬分子的動態行為外,也可以用來模擬分子的靜態結構。
在藥物設計中,最常被我這篇網誌提及的兩個方法分別是 分子嵌合(Molecular Docking) 與 分子動力學模擬(Molecular Dynamics Simulation, MD):
分子嵌合,又譯分子對接,是分子模擬的重要方法之一,其本質是分子間的識別過程,過程涉及分子之間的空間和能量匹配。不過說實話,分子對接這個翻譯搞不好比較熱門,但我這邊還是先以教育研究院雙語詞彙的翻譯為主。
嵌合的主要目的是找到受體與配體最佳結合位置及其結合強度,在過程中會透過電腦模擬將配體放置於受體的結合區域,再通過計算物化參數預測兩者的結合自由能和方式,最終可以獲得受體與配體的結合構型。結果所得出的可能構型不只一種,一般認為自由能最小的構型存在的機率最高,但不一定是最佳結果。
受體與配體的結合力
既然提到受體與配體的結合與自由能,這邊還是稍微說明下兩者之間的關係。
受體與配體的結合端賴分子間作用力,其中並未進行化學反應,也沒有生成共價鍵,因此這樣的結合方式是可以拆解,也是可以被取代的。所以有可能出現因作用力不夠強烈,而導致脫靶現象。
血紅素與氧氣及一氧化碳的三角關係就是一例:身為受體的血紅素在平時都與氧氣結合,但是當空氣中的一氧化碳濃度過高時,血紅素就會拋下氧分子,選擇和一氧化碳分子結合。這是因為一氧化碳對血紅素的親和力大過於氧氣的親和力,所以在與受體結合的競爭關係中,親和力越大的分子越容易取得勝利。
那麼親和力與前述所說的自由能又是?
親和力(Affinity)一詞最早是屬於化學領域的一個概念,特指一種原子與另外一種原子之間的關聯特性;而自由能則是物理化學的名詞,在熱力學第二定律中,所有反應過程中能自發進行達到的程度都是由初態反應物與終態產物之間的自由能變化決定的。在用於描述受體與配體之間的自由能,稱之為結合自由能(Binding Affinity/Binding Free Energies)或 結合能(Binding Energy)。
在實際的配體-受體複合物體系中,一般結合自由能只受非鍵相互作用力 (non-bonded interactions)的影響。這作用力較弱且能量低,存在於大部分體系中,主要由三項構成:凡得瓦力、靜電作用和氫鍵作用。因為非鍵相互作用力的結合是可逆的,有利於自身的代謝和排泄,但也可能出現脫靶現象。
總而言之,藥物設計的結合自由能主要看非鍵相互作用力,結合自由能越低表配體-受體結合所需能量越低,親和力越高,越容易結合。
分子嵌合的原理和類別
受體與配體結合必須滿足互相匹配原則,除了必須滿足靜電、氫鍵與疏水相互作用互補匹配,另外還須滿足受體與配體幾何形狀互補匹配。
鎖鑰理論(Lock and Key Theory):
19 世紀 80 年代初期,德國化學家 Emil Fischer 提出,分子和生物細胞之間的關係存在高度的專一性,就像鎖頭和鑰匙一樣,在空間形狀上要互相匹配,每道鎖都必須利用某把特定的鑰匙才能夠打開。
在鎖鑰理論中將受體與配體視為剛性不易變動的結構,此理論能夠說明結合前後三維結構變化較小的情況,但對結合前後三維結構變化較大的情況無法解釋。
誘合理論/誘導契合(Induced-Fit Theory):
然而,也有一些理論認為受體是柔性分子而非固定不動的剛性結構,因此可以在與形狀不完全相合的配體結合時,改變自己的構型去配合配體的形狀,這種具有較大彈性的配對結合方式,亦即受體會受到形狀不合的配體誘導而改變構型與之結合。
根據上述兩種理論與受體與配體的剛柔特性,嵌合的方法可分為 3 類:
整體來說
分子動力學模擬是一種分子模擬方法,該方法以經典力學、量子力學、統計力學為基礎,利用電腦數值求解分子體系運動方程的方法,類比研究分子體系的結構與性質,模擬分子體系在一段時間內,位置與速度的運動軌跡,從而以動態觀點洞察系統隨時間演化的行為。是繼實驗和理論兩種研究方法之後,研究分子體系結構與性質的第三種科學研究方法。
研究蛋白質和配體的結合模式中,嵌合與動力學模擬是兩個最重要的計算生物學方法,各有特點,相互補充:
如果把嵌合比喻為一幅圖片,那麼動力學模擬就像是一幀楨畫面組成的動態電影
雖說嵌合依照受體與配體的剛柔特性區分會有 3 種嵌合方式,但即便設置柔性嵌合,蛋白質也只是活性口袋的幾個氨基酸殘基在動,其餘幾乎是固定的,並不能展現蛋白質的整體運動;此外,嵌合並未考慮時間因素,只看是否結合,因此非常有可能結合後馬上就掉下來了。
反之,在進行動力學模擬時,根據誘合理論蛋白質會作出相應的構型改變去適應配體,蛋白質整體都會產生運動。另外更重要的是它能夠模擬實際情況,通過控制諸如溫度、壓力、原子數、離子濃度和溶劑的類型等不同因素進行實驗,達到控制蛋白質的柔性程度、觀察運動軌跡的目的。
因此做動力學模擬是有必要的!
可以為互相對方提供不同初始條件
出於優化受體與配體的目的,可以讓兩者相互配合,互為相對方提供不同初始條件。
若蛋白質結構是從公開資料集或是預測所得,則可能需要先進行動力學模擬,產生更多或更優的起始蛋白質構型。而在執行動力學模擬之前,可能需要先進行嵌合提供不同的初始結合模式,增加模擬的多樣性,提高模擬效率。
因此,在實務上嵌合與動力學模擬可能不只執行一次,由哪個操作開始也未定,端看你的資料與應用。不過我在論壇中看到是推薦先做嵌合,再做動力學模擬,原因如下:
藥物篩選是在藥物設計流程中找出具有特定生理活性化合物的一個步驟。它會通過實驗、模擬或預測等方式,從大量化合物找出對靶點具有高活性的化合物的過程。從維基百科給的流程圖看來,廣義的藥物篩選步驟涵蓋了 Target to Hit 與 Hit to Lead 兩個階段。
常用的篩選方式有高通量篩選(High Throughput Screening,HTS)和虛擬篩選(Virtual Screening,VS)。
高通量篩選是伴隨組合化學而生的一種藥物篩選方式。它是以分子等級和細胞等級的實驗方法為基礎、自動化的操作實驗系統執行試驗、高靈敏度檢測系統及數據採集系統搜羅實驗結果,最後以電腦分析處理實驗數據的一門技術。
高通量篩選可以通過一次實驗獲得大量的訊息,並從中找到有價值的資訊,可應用於對現有化合物資料庫的篩選,是當今藥物開發的主要方式。
先撇除偽陽、偽陰的結果誤判,高通量篩選亦存在許多問題:
化合物樣本來源短缺、試劑和儀器昂貴
先前提到高通量篩選是以實驗方法為基礎,因此需要實體樣本與儀器。但有些化合物樣本數量稀少或是難以取得,甚至不是天然化合物;此外,此方法所需使用的試劑和儀器都非常昂貴,除大型製藥公司外,大部分科研單位都無法配備。
通用性不高
很多高通量篩選方法只能對一種或幾種酶具有適應性。
我們先回到 Clara Discovery 上。因高通量篩選是藉由實驗篩選所得,應該不屬於電腦輔助藥物設計。不過如果硬要把它對應到流程圖中,應該會對應到圖中 SEARCH
,也就是活性化合物的篩選 Target to Hit 階段。此階段所得的化合物,需要再進行活性測試與最佳化,以得到一系列先導化合物。
由於實體藥物篩選需要取得大量的化合物樣本,以構建大規模的化合物資料庫,並且需要昂貴試劑和儀器支持。因此隨著電腦輔助藥物設計的快速發展,虛擬藥物篩選成了是藥物篩選技術發展的另一個方向。
虛擬篩選為發現特定生理活性化合物提供了一種快速而經濟的方法。因為它是將其篩選過程在電腦上模擬,因此不存在樣品限制與消耗,從而降低篩選成本、縮短新藥研發週期,並加入考慮化合物分子藥動學性質和毒性等因素。除此之外命中率也獲得了提升,相較實驗性高通量篩選的典型命中率 0.01% ~ 0.14%,虛擬篩選可提升至 2% ~ 40%。
虛擬篩選會因藥物設計開發法的不同而有不同的工作流程:基於分子嵌合的虛擬篩選、基於藥效團的虛擬篩選
基於分子嵌合的虛擬篩選
分子嵌合我們前面提過,它是基於標靶三維結構的分子模擬,通過多個分子間的識別,綜合分析得分,找到受體與配體最佳結合位置及其結合強度,為候選化合物的挑選提供依據,篩選潛在活性化合物。
前面提過 Clara Discovery 就是採用基於結構的藥物設計設計法來開發的,所以在 Clara Discovery 中應該是基於分子嵌合的虛擬篩選。若將虛擬篩選對應到流程圖中的 SEARCH
+ DOCKING
,而嵌合結束後的虛擬篩選也被歸入 DOCKING
中,因為常見執行分子嵌合軟體都有提供虛擬篩選的設置。
另外,由於嵌合的過程對化合物結構並沒有限制,基於分子嵌合的虛擬篩選完全有可能獲得結構新穎的先導化合物。
是說我怎麼感覺基於分子嵌合的虛擬篩選好像是直接從 Target to Lead?
基於藥效團的虛擬篩選
藥效團(Pharmacophore)的概念是指一組化合物與同一標靶結合時,所需的特定原子和官能基的空間分布,這個概念的本質是從具有相同機理的不同化合物中,提出決定活性的共同結構特徵,而強調的是呈現活性的功能基團之性質和位置。
我放棄理解這句話的意思,直接上結論吧 XDDD
藥效團篩選的計算量較小,可以在分子嵌合前進行,篩選只需要很短時間。另外,此篩選法所獲得的化合物與建模所用的化合物結構性質類似,在發展新穎先導化合物方面具有一定的侷限性。
藥物設計流程大概到這邊告一個斷落,至於 Clara Discovery Toolkits 就請期待下集吧,應該不會太久,都被要筆記要到三次元來了。
🤟 喔耶~我完成了~~ → NVIDIA Clara Discovery - Toolkits 篇
本文作者: 辛西亞.Cynthia
本文連結: 辛西亞的技能樹 / hackmd 版本
版權聲明: 部落格中所有文章,均採用 姓名標示-非商業性-相同方式分享 4.0 國際 (CC BY-NC-SA 4.0) 許可協議。轉載請標明作者、連結與出處!Flow