Accelerating Model Development and Deployment for Drug Discovery and Life Sciences [S73097] 加速藥物發現和生命科學的模型開發和部署 [S73097] ![image](https://hackmd.io/_uploads/HkH7nLi2ke.png) 首先,感謝大家今天一大早就到場參與。我非常感激各位能撥冗出席。我希望能為大家帶來一些令人振奮的更新,分享我們在數位生物學(Digital Biology)領域的最新進展。同時,我也會多談談我們的關鍵合作夥伴,他們的支持讓这一切成為可能。 我想從一個話題開始。你們可能已經在週二下午聽過Kimberly Powers,我們的醫療保健部門副總裁兼總經理(VPMGM of Healthcare)的演講。我之所以想特別提到這一點,是因為我們最初是在醫療保健與生命科學(Healthcare and Life Sciences)領域起步,聚焦於那些有明確應用價值的方向,也就是所謂的「垂直應用」(Vertical Applications)。這些應用奠基於一個更廣泛的醫療保健水平計算平台(Horizontal Computing Platform for Healthcare)。 或許讓人有些意外的是,我們從影像放射學(Imaging Radiology)這樣的領域開始。如今,這類應用已成為人工智能(Artificial Intelligence)在醫療保健中的「麵包、奶油和巧克力」——也就是最基本且廣泛採用的應用。但在過去十年裡,隨著我們的發展,我們發現AI技術在各種不同領域有著驚人的應用潛力。今天,我將特別針對產品面,介紹兩個具體案例。你們可以在幻燈片底部看到許多產品名稱,列在電子郵件和段落中。這些都是我們生物學團隊(Biology Team)開發的產品。 我之所以想展示這些,是因為NVIDIA平台以及整體計算技術在生物學中的應用範圍正變得越來越廣泛。如果大家仔細看這張幻燈片——雖然我沒辦法用雷射筆指到那麼遠——從右邊開始,你會看到我們的推理加速平台(Inference Acceleration Platform),像是TensorRT。今天你們會看到一些例子,這些技術被應用在我們開發的AI模型上,特別是在生物學領域,實現了巨大的速度提升。這不僅適用於語言模型(Language Models)——你們可能通常會聯想到像TensorRT這樣的工具——也用於結構模型(Structure-Based Models)和藥物設計(Drug Design)。 以BioNemo為例,我們在其中做了大量工作,這些創新來自過去七、八年對於如何擴展基礎模型(Foundation Models)的學習。這是基於我們的Nemo平台,對吧?這個平台原本應用於大型語言模型(Large Language Models)和影像處理(Imaging),但我們能夠將這些技術經驗應用到生物學領域,甚至延伸到更廣闊的空間,比如分子結合(Binding of Space)。還有像Rapids和GPMSA這樣的技術,它們的應用範圍非常廣泛,且在加速數據對齊(Accelerating Alignment)和動態數據處理(Accelerating Data Processing for Dynamics)方面越來越重要。我們稍後會稍微談談這一點。 或者以你們可能熟悉的AlphaFold模型為例,全球有許多人在使用它。我們也在加速數據處理流程(Data Crossing Pipeline),讓數據在進入模型之前能更有效率。所以,我不會一一細數幻燈片上的每一個項目,但我想說的是,這裡沒有一個技術是我们未曾在數位生物學領域中加以利用的。這一點非常令人振奮! 接下來,這是另一張你們可能看過的幻燈片。我很喜歡這張幻燈片,因為它告訴我們,我們如何開始生成理解生物學所需的核心真實數據(Core Ground Truth Information),以及如今我們如何透過高效的AI模型充分利用這些數據。如果你看向左下角,從2000年代開始,你會看到我們早期在基因測序(Sequencing)方面的工作。這場革命為我們現在的許多研究奠定了基礎。到了單細胞工作流程(Single Cell Workflows)和單細胞數據生成(Single Cell Data Generation),這些技術變得極其重要,特別是用於生成像AlphaFold這樣的模型所需的數據,甚至包括Cryo-EM(冷凍電鏡)等結構測定方法。 展望未來,這些工具與AI的整合將實現像「誠實實驗室」(Honest Labs)這樣的應用。我們在生成和分析實驗室數據方面有著堅實的基礎,這對於我們整合所有資訊並建立生物學的有用表徵(Useful Representations of Biology)至關重要。AlphaFold是這類模型的第一個例子。我希望大家能留下來聽10點的演講,因為Max會深入講解更多內容。他會在這裡談論他們過去、現在和未來的計畫,我相信一定很精彩。 當我們進入新領域時,AlphaFold利用了APDB數據庫,那裡儲存了大量的結構數據。但現在,你們看到的是許多模型開始整合來自不同技術的資訊——這些技術就列在幻燈片底部。這真的是個令人興奮的時刻!在接下來的半小時左右,我會告訴你們我們如何支持這一切。 我們思考這個問題時,我把這條線放上來,主要是作為大家心中的一個組織原則(Organizing Principle)。「人在迴圈中」(Human in the Loop)這個主題有很多變體,但核心概念是:我們從生成大量數據開始。你會看到許多人在指數級地生成更多數據。這一點並未因為我們長期從事這項工作而變得不重要,反而在現實世界和合成數據(Synthetic Data)環境中變得更重要。 我們需要訓練整合來自不同來源和形式(Modalities)的資訊的模型,這需要我們開發技術,讓這過程變得快速、簡單且高效。接著,我們可以用這些模型進行有用的預測,可能是作為「銀標準」(Silver Standard)的矽基預測(In-Silico Predictions),甚至在某些情況下生成聯邦快遞級別的數據(FedEx Elevator Data)。 通常,我們會把這些模型串聯成完整的工作流程(Workflows)。我們如何優化這樣一個端到端的系統,讓不同模型之間能夠互相溝通?當你完成這一切並做出有用的預測後,這些預測要麼指導你決定下一個實驗室實驗的方向,要麼你利用這些資訊,從實驗室實驗中獲取「金標準」(Gold Standard)標籤——無論你在測量什麼——然後將其反饋到你的訓練程式碼中,對吧? 這真的是一張AAA級的開場幻燈片(Stage Setting Slide),主要是為了讓大家對我們接下來要講的內容有一個整體概念。幾乎所有我們將要討論的主題都可以融入這個「飛輪」(Flywheel)模式。我認為可以合理地說,這個模式涵蓋了生物學領域中AI發展的許多應用,跨越不同層面,適應這個範式(Paradigm)。 首先,我想和大家分享我們在NVIDIA平台上針對遺傳學(Genetics)的最新更新。這是一個非常成熟的平台,我們很幸運能在過去多年裡持續投入並打造它。我們的目標一直是加速遺傳學科學領域的高通量分析(High Throughput Analysis)。我們透過一項名為Parabricks的技術實現了這一點,這項技術就像一段生命故事(Life Story),成為我們在二級分析(Secondary Analysis)中的核心。例如,它加速了人們在內部科學狀態下所做的所有工作。 現在我們觀察到,隨著我們生成大量數據,並能夠處理這些數據並使其變得有用,數據生成本身與我們附加其上的AI技術之間的聯繫正變得越來越顯著。如果我們看看我們的遺傳學生態系統(Genetics Ecosystem),我們會發現我們在整個生態系統中實現了多重目標。我們與每個儀器平台(Instrument Platform)的合作夥伴密切合作,涵蓋所有ISVs(獨立軟體供應商)和雲端平台(Cloud Platforms)。這裡列出的絕對不是完整的清單。此外,我們與業界以及研究機構緊密合作,他們是我們與合作夥伴共同部署技術的消費者。 其中一個令人驚嘆的例子,是我們與儀器合作夥伴合作的方式持續加速的成果。這項工作在Kimberly的主题演講中也有提及,是關於羅氏(Roche)的SPX平台。這真的很了不起!雖然我無法在這裡播放影片,但如果你有機會,可以去YouTube搜尋相關內容,看看這項技術的運作方式。我第一次看到時真的覺得非常震撼。我們把基因測序(Gene Sequencing)這項原本極其昂貴的活動,轉化成能在短短一小時內以合理覆蓋率完成多個基因組的任務。 這是我們在數據生成類型和遺傳學測序(Genetics Sequencing)方面的下一個前沿領域。我們與羅氏的合作整合了Parabricks的工作,以及其他加速技術,例如TensorRT,融入這個平台,讓它運作得如此之快。Parabricks平台,或者說我們的動態平台(Dynamics Platform),不僅限於遺傳學,還適用於基因組學(Omics)。這一點很快就會變得顯而易見。這是我們的GPU加速軟體套件,適用於所有基因組學領域。如果你很熟悉這個平台,你會看到我們在二級分析(Secondary Analysis)中做了大量工作。這是我們的主力產品(Bread and Butter)。 我們實現了極快的序列比對(Alignment)。在幻燈片左邊,你可以看到相關指示——雖然我沒能用指標清楚標示——我們投入了大量資源,讓這個平台的最新版本速度大幅提升。比對速度快了很多。此外,我們還有非常出色的變異識別(Variant Calling)技術。你們會看到這兩者如何相互作用,我們將它們整合成藍圖(Blueprints),稍後會再詳細談談。 更重要的是,正如我之前提到的,我們結合NVIDIA更廣泛的技術,推動AI與動態學(AI plus Dynamics)的革命。這是因為產業在數據處理能力上的驚人進展所帶來的結果。隨著這個領域的成熟,在Parabricks 4.5版中,我們專注於三個主要領域。你可以在幻燈片左邊看到一些項目,我會逐一詳細說明。 首先,我們專注於提升現有技術的核心性能(Core Performance Improvements)。其次,我們將這些技術延伸到Blackwell平台(Blackwell Platform)。我會稍微展示一下,這讓Parabricks在Blackwell上更快、更具成本效益,適用於許多工作流程(Workflows)。我會在這裡給你們一個小小的預覽,介紹我們在工作流程加速上的額外成果,例如Drafft和Variant。 這是我們與下一代Blackwell GPU合作的一個例子,也就是我們的Arctic系列Blackwell GPU,稱為RTX 6000。我在這裡展示兩個不同的加速案例(Vignettes)。在中間,你可以看到我們與上一代L4 GPU相比的性能提升,特別是在序列比對(Alignment)上。右邊則展示了一個完整的端到端工作流程(Full-Term Workflow),在我們的4路RTX系統上,現在比96路CPU系統快了135倍。我們也在上一代平台的基礎上獲得了增量改進。 再看看我們在Drafft和Variant方面的工作,與L4基準相比,這個平台的運行時間快了6倍,特別是在變異識別(Variant Calling)方面。Parabricks的核心功能有了顯著提升,我們最近持續投入資源加速這一切。我覺得這真的很酷!這也將引導我們進入單細胞動態學(Single Cell Dynamics)的討論。 我們有一個與AC Verse合作開發的庫,叫做Rapid Single Cell。這是一個很棒的庫,提供了巨大的加速。如果你熟悉Rapids——我們長期以來用於加速數據科學(Data Science)和Python數據生態系統(PyData Ecosystem)的平台——你可能知道像CuML和CuDF這樣的庫,它們是Pandas和Scikit-learn的替代品。Rapid Single Cell利用了我們在這些經驗中的許多成果,將其延伸並應用於單細胞生物學(Single Cell Biology)中常見的工作流程。 這些是基於Scanpy優化的版本。左邊的數據展示了驚人的加速效果,例如PCA(主成分分析)速度快了近700倍,幾乎是兩個數量級的提升。這裡的數據實際上是1100萬單細胞數據集(而不是100萬),這是非常驚人的數字。我們看到了端到端的運行性能提升,如右邊所示,總體加速接近200倍。這是我們長期透過Rapids工作實現的單個組件加速成果。 在擴展Parabricks平台方面,我們做了很多努力,有些是革命性的性能改進,有些是對新工具的持續投資。這次演講中我想強調的一個主題是,我們在基因組學(Genomics)方面的工作如何與公司其他領域的工作相關聯。我們將傳統應用於其他領域的AI技術引入生物學領域。 我們有許多相關的公告,但我無法在這次演講中一一涵蓋。但例如,我們在Mona中針對影像(Imaging)、病理學(Pathology)和高解析度成像(High-Content Imaging)的工作,或者在BioNemo中的工作——我將在下一部分深入探討——這些AI模型利用了我們如何加速Transformer模型的基礎,並將其延伸到處理和理解生物數據所需的獨特架構。 我們透過嵌入(Embedding)等方式整合這些經驗教訓,形成對生物學更大、更完整的理解。我之前提到過Rapid Single Cell的工作,這是處理數據的核心基礎,對於整合這些成果至關重要。 接下來,從遺傳學平台轉換話題,我要談談我們在生物學平台(Platform for Biology)上的許多工作。我們將從BioNemo開始討論。這張圖旨在讓你了解我們為AI與生物學打造的完整平台,我們稱之為BioDepot。BioNemo已經存在約兩年了,我們用它完成了一些非常了不起的事情。 我或許可以播放這個動畫給大家看——真的很酷!但這裡有三個主要組成部分,大家需要先理解一下。首先,我們有庫(Libraries)和訓練框架(Training Framework),對吧? 這些是針對生物數據(Biological Data)中獨特挑戰而設計的加速庫(Accelerated Libraries)。在我的演講中,你們會看到幾個例子,雖然這些並非全部。隨著我繼續講解,這些加速庫是在一個訓練框架(Training Framework)中使用的。這是我們對於如何利用NVIDIA的加速技術(Acceleration)的觀點,這是我們在過去七、八年裡學到的經驗教訓,正如我之前提到的。 具體來說,這涉及到如何運用Transformer模型(Transformer Models),以及日益新穎且更具創意的架構(Exotic Architectures),這些架構對於解決生物學中的問題特別有用,並用來訓練AI模型。接著,我們找到了一個高效的方式來部署這些模型。我們是NVIDIA便捷微服務生態系統(Microservice Ecosystem)中的重要一員。我們已經推出了非常多的模型(MIMs),涵蓋各種不同的應用場景(Use Cases)。 其中一些是可以在這個框架中訓練的模型類型,目前主要是基於序列的模型(Sequence-Based Models)。但我們也有針對蛋白質結構預測(Protein Structure Prediction)、蛋白質生成(Protein Generation)和設計工作流程(Design Workflows)的模型。此外,還包括多聚體(Multimer)、複雜工作流程(Complex Workflows)和後處理預測(Post-Prediction),比如處理一些困難的問題。我會稍微說明我們的庫和框架如何幫助我們讓整個生態系統變得更好、更快、更高效。 當我們轉到幻燈片右邊的藍圖(Blueprints)時,單個模型(Individual MIMs)本身就很有用。它們在大規模應用時很有價值,尤其是當你從這些模型中生成大量數據時,效果尤為顯著。但現實世界的工作流程(Real-World Workflows)往往需要整合多種不同的模型和技術。因此,我們將這些工作流程整合成藍圖(Blueprints),並以多種方式提供給大家。我稍後會詳細介紹這一點。 我們現在正在將這一切應用到從遺傳學(Genetics)、化學(Chemistry)到生物學(Biology)的各個領域。此外,我們與一些合作夥伴合作,將這些技術延伸到推理(Reasoning)和語言模型(Language Model)類型的操作,這一點我之前也提到過。 那麼,我的框架叫什麼名字呢?這個框架——BioNemo框架(BioNemo Framework)——是在訓練超大規模模型(Large-Scale Models)的傳統基礎上進行擴展和改進的。那麼,如何運用AI模型呢? 那麼,你如何在一個大型集群(Large Cluster)中分解這些工作?你如何提出問題,又如何訓練這樣的模型(Train That Model)?對於生物化學動態數據(Biological Chemical Dynamic Data),我們需要做一些特別的事情,這與我們處理其他領域的方式有所不同,例如大型語言模型(Large Language Models)或影像處理(Imaging)領域。 因此,我們能夠訓練規模達到數十億參數(Billions of Parameters)的模型。最近,我們與方舟研究所(Ark Institute)合作發布了一項成果,名為Evo 2,這是一種全新的架構(Novel Architecture),可以將AI模型擴展到400億個參數(40 Billion Parameters),這在生物學領域是非常大的模型。我們為生物應用(Biological Applications)打造了客製化的架構(Custom Architectures)。這些應用需要的功能包括對非常非常長的序列(Very Long Sequences)進行排序和推理(Sequence and Reasoning)。 其中一個關鍵點是超大的輸入上下文(Very Large Input Context),但這當然不是唯一重要的部分。對生物數據(Biological Data)的推理有其獨特性。我們以模組化(Modular Fashion)的方式來處理這一點,這意味著我們意識到這是一個快速發展的領域。我們知道需要找到通用的方法(Generalize),讓所有正在開發這類模型的人都能加速,而不僅僅是專注於某一種特定的模型架構(Model Architecture)。 每當我們發現如何讓某個部分更快時,我們都會試著找出如何在適當的層次上公開這些成果,讓每個開發模型的人都能加以利用。我會給大家展示幾個例子,來說明我們如何與部署這些工具的方式配合。我們提供了多種部署方式,包括在PyPI上開源(Open Source)、以容器形式提供(Containers),以及企業版本(Enterprise)。 我們也非常注重社區驅動(Community Driven)。這是一個研發(R&D)領域,我們與在場的許多人合作——我知道這裡有很多熟面孔,他們也來聽這場演講。我們從你們所有人那裡得到的反饋,告訴我們應該朝什麼方向努力,未來能為你們解決什麼最重要的問題。 這也意味著我們是公開開發(Developing in the Open)的。你們可以參與其中,直接告訴我們下一步該做什麼,我們可以透過合作的方式來實現這一點。我們正在逐步圍繞BioNemo框架(BioNemo Framework)中的一些工作建立工作組(Working Groups),以確保未來能正式滿足這些需求。 那麼,這具體意味著什麼呢?讓我們用一個非常簡單的例子來說明。我相信大家都聽過ESM-2模型(ESM-2)。在幻燈片左邊,你可以看到6500萬參數(650 Million Parameters)的版本;右邊則是30億參數(3 Billion Parameters)的版本。你會發現,在不同模型規模下,ESM-2在我們的A100和H100系統(A100 and H100 Systems)上獲得了相當不錯且一致的加速效果(Speedups)。 具體來說,在A100上速度提升了大約1.7到1.8倍,相較於原始基線(Baseline)的標準實現(Standard Implementation),在H100上甚至超過2倍的加速。我們的擴展性(Scalability)也非常出色。左邊的數據是標準化到單個節點(Individual User Nodes)的,我們基於完美擴展(Perfect Scaling)實現了極高的性能。透過BioNemo,相較於你在標準實現中可能得到的結果,我們的表現更優異。 我們還實現了各種改進,讓模型能處理更大的分支規模(Larger Batch Sizes)。這些都是實質性的功能提升(Functional Improvements),無論是在性能(Performance)還是能力(Capabilities)上。當我們在一個強大且可重複的平台上設計東西時——例如BioNemo框架,這是基於多年投資和對模型擴展的理解所建立的——我們就能獲得這些成果。 接著,我們進一步擴展了在Transformer領域(Transformer Space)或AI模型領域中針對序列(Sequences)能做到的事情。這裡有一個架構的例子,名為Evo(Evo Architecture)。它最早可能在Evo-1中被使用,那是方舟研究所去年發布的模型。而Evo-2是我們今年與他們團隊合作的成果。這非常有趣,也讓我們學到了很多關於如何在BioNemo框架中構建新架構的知識。 這一點至關重要,因為這些架構對於生物學中的需求特別有用。例如,在這個案例中,它能推理(Reasoning)極長的序列(Very Very Long Sequences)。這裡展示了一些性能基準(Performance Benchmarks),在A100和B200系統上,我們在BioNemo框架中再次獲得了顯著的性能提升(Evolutionary Performance Improvements),擴展性極佳(Extremely Good Scaling),並在處理超長序列時表現出色。 這是我們今年早些時候與在場的一些作者共同發表的成果。這是方舟研究所與我們直接合作的產物,還有一些學術界和產業界的合作夥伴也參與了論文的撰寫。它完全是開源的(Open Source)。對社區來說,這意味著你現在有了BioNemo這樣一個可重複且穩健的平台。你可以獲取Evo-2的訓練檢查點(Train Checkpoints),包括70億和400億參數的版本,並擁有一個可以用來訓練、微調(Fine-Tune),最終部署這些模型的平台。 我們還提供了一個包含Evo模型的可部署實例(Deployable MIM),配有我們與方舟研究所共同設計的API。這真是太棒了!在BioNemo之上,我們有了新的架構(New Architectures),讓我們能做到過去無法實現的事情。 簡單介紹一下我們對BioNemo中模組(Modules)的思考,這裡有兩個例子,但並非全部。我們希望做到的是——正如我之前提到的——找到常見的加速點和痛點(Common Acceleration and Pain Points),為社區做出貢獻,讓開發模型的人能輕鬆使用。 其中一個例子是我們最近加入BioNemo框架的套件(Package),但它也可以獨立安裝。你可以直接選擇安裝它。這就是為什麼我在右上角放了一個從PyPI網站提取的小圖標。這個套件是一個內插庫(Interpolate Library),特別適合用來構建和探索生物學中的架構擴散(Architectural Diffusion)和氣候分析(Climate Analysis)。 這些在圖像生成(Image Generation)中很有名,比如生成測試圖像(Test Images)。但在序列和結構設計(Sequence and Structure Design)中,它們也非常重要。在演講後半部分,你會看到許多模型利用了完全匹配(Full Matching)和擴散(Diffusion)方法來進行分子設計(Molecular Design)。這些模型涵蓋了連續(Continuous)和離散(Discrete)的類型。你可以在框架中使用它,也可以將其作為獨立模組來設計這些東西。 我們還打造了出色的數據載入器(Data Loaders)。這是一個我們已經投入相當時間的庫,類似於你在Rapid Single Cell中看到的東西。這個庫名為BioNemo ACDL(BioNemo ACDL),特別適合載入單細胞數據(Single Cell Data),用於在BioNemo中訓練AI模型。它同樣可以獨立安裝,作為一個單獨的記憶體高效庫(Memory-Efficient Library),基本上與NVIDIA API實現了一對一映射(1-to-1 Map),速度提升了大約5倍。 對於熟悉這類技術的人來說,你會發現它的使用方式與你已經做過的非常相似。但我們在BioNemo中實現了這一點,並顯著提升了性能。這在訓練模型或進行大規模推理時尤為重要。我們提供了大量入門教程(Tutorials),線上有豐富的文檔(Documentation)。下一張幻燈片會展示獲取這些資源的各種方式。 請務必線上查看我們的文檔,看看教程,訪問GitHub,了解我們在做什麼。你可以實時看到我們工程團隊的工作。我們對這個框架的構建是公開且透明的(Open and Transparent)。請加入我們,告訴我們需要做什麼來讓這個框架變得更好。 你可以用多種方式使用這些資源。我提到過開源的GitHub途徑(Open Source GitHub Route),這是大家期待的,完全公開開發,採用非常寬鬆的Apache許可證(Apache License)。我們還有一個在NGC上打包的開源版本(NGC Open Source Version)。這很方便,因為我們為你處理了整個依賴堆棧(Dependency Stack),你只需啟動容器(Container),一切就能正常運行。 我強烈推薦這個版本,沒有額外費用,你可以直接下載使用。如果需要企業支持(Enterprise Support),我們也提供這項服務。你可以透過我們的現場團隊聯繫我們,我們會提供協助,並為與框架相關的業務組提供支持。 接下來是倒數第二部分。我們已經有了構建這類模型的框架。那麼,一旦我們適應了這些模型(Adapt Models),我們該做什麼?我們如何在大規模上利用這些模型? 因此,我們一直是這其中的一部分。我們在微服務領域(Microservice Space)從一開始就有所作為,特別是在NVIDIA的服務方面,我們其實是這個領域中最活躍的發布者之一(Prolific Publishers)。NVIDIA提供的是一個全棧解決方案(Full Stack Solution)。這意味著你會得到一個優化的模型,包含所有依賴項(Dependencies),全部打包在一個單一容器(Single Container)中,你可以下載並部署,還附帶一個適合該模型的API。這一切都很合理,對吧? 我們花了很多心思來優化這些模型。例如,在Evo-2(Evo-2)、ESM(ESM-2),以及後面會提到的許多模型中,你會看到非常具體的性能數據(Performance Figures)。我們確保這些模型能以NVIDIA所能達到的最快速度運行,並定義了一個API,讓它們更容易在大規模部署(Deploy at Scale),然後融入你的工作流程(Workflow)。我們還有一些工作流程的例子,這些被稱為藍圖(Blueprints)。 接下來,快速回到動態學領域(Dynamics Space)。這是我們在開發模型(MIMs)和藍圖(Blueprints)方面的新進展。本週,我們發布了第一批針對基因組學(Genomics)的兩個模型。第一個是對齊模型(Alignment MIM),這是一個易於調用的微服務(Microservice),用於序列比對(Alignment)。第二個是變異識別模型(Variant MIM),用於變異識別(Variant Calling)。這些都是可下載的模型,你可以在我們的網站上找到它們。你們熟悉並喜愛的NVIDIA微服務生態系統(Microservice Ecosystem)的所有特點,在這裡同樣適用。 此外,我們還將這些模型整合到第一批針對動態學分析(Dynamics Analysis)和單細胞分析(Single Cell Analysis)的藍圖中。在幻燈片左邊,你可以看到一個例子,它整合了我今天提到的許多技術,例如Rapid Single Cell,將其嵌入一個完整的藍圖中。右邊也有類似的故事,涉及Parabricks和變異識別,用於基因組學分析(Omics Analysis)。 當你思考這些藍圖時,有幾個關鍵點要記住。對我們來說,藍圖是參考(References)。它們教你如何將這些加速的微服務(Accelerated Microservices)組合成一個有用的工作流程。但它們也很靈活,你可以加入其他容器(Containers)或其他技術,插入這些工作流程中,打造出完全適合你的藍圖。 在介紹我們與一些合作夥伴的例子之前,我想簡單推廣一下。你還有幾天時間——截至3月22日——掃描這些QR碼,從我們的合作夥伴那裡獲得一些免費點數(Free Credits)。你可以用這些點數部署單細胞分析藍圖和動態學分析藍圖,並獲得計算資源(Compute Access),讓你可以體驗我們這裡開發的技術。請務必試試看,沒有什麼特別的限制。 在模型生態系統(MIM Ecosystem)中,我們也在結構生物學(Structural Biology)和小分子設計(Small Molecule Design)方面發布了很多內容。接下來我要講得稍微技術一點,告訴你們一些我們如何讓這些模型更高效、性能更好的驚人成果。 我們研究了像AlphaFold這樣的模型,顯然它現在非常有名。還有其他模型也逐漸達到這種知名度,比如一些人可能知道的擴散模型(Diffusion Models),例如DiffDock,用於結構生成(Structure Generation)。還有新的模型,比如GenMol,我馬上會提到。重要的是,這些都以NVIDIA微服務的形式提供(MIMs as NVIDIA Microservices)。 在每一種情況下,我們都拿到了這些模型架構(Model Architectures),並學會了如何讓它們更高效。結果是一比一(1-to-1),你會得到完全相同的結果。例如,在AlphaFold中,我們現在有一個模型(MIM),在單個DPU推理(DPU Inference)上比公開的標準實現(Standard Implementation)快5倍。我們在這方面做了驚人的工作,並將這些成果封裝到一個名為Coercive Variance的庫中,用來加速各種等變模型架構(Equivariant Model Architectures),在DPU上速度提升了7倍。 我們還創造了新的數據集(Datasets)、下一代模型(Next-Generation Models),並提高了這些模型的精度(Accuracy)和性能(Performance)。在ArcDiffusion(Arc Diffusion)上,我們比原始模型快了約2倍。GenMol是下一代模型(Next-Generation Model),它是基於片段的(Fragment-Based)。我無法完全用同樣的方式比較它的性能,但相關論文將在今年晚些時候發表,並將在ICLR上展示。它專注於基於片段的分子設計(Fragment-Based Molecular Design),我稍後會再提到。 接下來,我想談談三個讓我們非常驕傲的合作夥伴整合(Partner Integrations)。我們與這些夥伴密切合作。首先,我們與Myopia合作,部署了一個很棒的模型——Moment。你可以在幻燈片左上角看到Moment這個名字。這裡重要的是,BioVia實現的是一種「選擇你自己的預言機」(Choose Your Own Oracle)的方法,用於分子設計(Molecular Design)。 我們有Moment模型,還有一個優化器(Optimizer),讓你可以引入外部預言機(External Oracle)——也就是你自己的一些預測——來引導模型的進化(Evolution),生成新的候選分子(Candidate Molecules),並將其反饋到Moment中。你可以在BioVia平台上靈活地做到這一點。他們很快將我們的Moment整合到一個端到端(End-to-End)的定制藍圖中——不是我們發布的那個,而是利用相同技術的版本,讓他們的客戶能快速啟動並在平台上實現通用化學設計(General Chemistry Design)。 我們還與City of Scientists合作。這是一個超酷的實現,將許多通常難以訪問的技術整合到一個完全無代碼(No-Code)的平台中。他們將Moment、AlphaFold和DiffDock整合到他們的電子實驗室筆記本解決方案(Electronic Lab Notebook Solution)中。結果是,當你處理自己的數據時,你可以即時訪問化學設計(Chemical Design)、結構預測(Structure Prediction)等工作流程,以及這個數據藍圖的其他部分。 最後,但絕非不重要,我們與Cadence和OpenEye合作,在他們的Ryan分子設計平台(Ryan Molecular Design Platform)上整合了BioNemo。他們利用了我們最近發布的一些模型,尤其是PoseUltimate,這是AlphaFold的多重擴展(Multiple Extension),還有Moment,應用於他們的分子設計平台。 我還剩幾分鐘,想告訴你們我們正在進行的下一代工作(Next-Generation Work),讓你們了解接下來會發生什麼。我們一直在努力研究,並將成果應用到我今天提到的產品中。其中一個模型是GenMol,這是下一代基於片段的分子設計平台(Fragment-Based Generative Molecular Design Platform)。這種方法有很多優勢。 例如,你可以從你想填充的質量元素(Mass Elements)開始,將生成過程建立在個人用戶能理解的基礎上。現在很多人正在利用這一點,來擴展我們在Moment上的工作。本週我們還發布了新模型,包括MMCCan和OpenFold-2。這些模型經過我們的優化,速度大幅提升。例如,我們的MSA Search模型(MSA Search MIM)比標準實現快23倍,而OpenFold現在快了7.5倍。我們以同樣的方式為原始屏幕構建藍圖。 在這場演講中,你們聽到了很多關於我們如何進行加速的內容。我們稱之為「向下推棧」(Drive Them Down the Stack),意思是找到行業的關鍵瓶頸(Critical Bottlenecks),並以對開發者友好的方式(Developer-Friendly)公開解決方案。我們與所有開發生物學基礎模型(Foundation Models in Biology)的團隊合作。這些只是近期發布的一些重要模型的例子。 我們想做的是找到方法,針對這個領域的不同模型開發共同的加速技術(Common Accelerations)。最近,我們與麻省理工學院(MIT)及其在Genesis Therapeutics的合作夥伴合作,加速了一個名為Bolt-1的模型(Bolt-1)。Bolt-1是一個完全開源的架構(Open-Source Architecture)。透過TensorRT——我已經多次提到這個對我們很重要的庫——以及我們與cuDNN團隊打造的定制內核(Custom Kernels),我們實現了近5倍的推理性能加速(Inference Performance Speedup)。 現在我們在思考:我們知道如何將這些技術整合起來,也了解了一些早期的加速成果。如何將這些應用到下一代工作中,讓它們通用的實現?這是對未來的一點預告。請在其他會議上回來找我們,我們會確保這些成果能應用到整個下一代生態系統(Next-Generation Ecosystem)的生物創新模型(Biological Innovation Models)。 我很高興向大家介紹我們與Dante Therapeutics的合作。他們是我們的重要夥伴。Venti,我相信明天將宣布Neo-1,這是他們的原子結構(Atomistic Structure)和全新設計模型(Novel Design Model),是這類型的首創。還有DinoPoles,Dino Therapeutics也在這個領域合作,試圖理解並從動態學(Dynamics)中採樣,而不是單純運行基於物理的計算(Physics-Based Calculation)。這些技術合作夥伴帶來了令人驚嘆的創新。 但這不是故事的終點。我們有一個完整的生態系統(Ecosystem),將這些技術整合起來,在我們設計分子的能力前沿(Bleeding Edge)不斷創新。生成設計(Generative Design)、工作流程結構(Workflow Structure)、預測工作流程(Prediction Workflows)——我們為與屏幕上看到的每個人,以及我們整個技術生物製藥(Tech Bio Pharma)和數位生物學生態系統(Digital Biology Ecosystem)的合作感到非常驕傲。 至此,我要結束了。感謝你們的參與,感謝你們來到這裡。我們原本想多講一些,但不幸的是沒有時間提問。不過,希望之後能見到你們!