###### tags: `week2` ###### tags: `課前準備` # U: Live Session 2 課前準備 ### 本次關鍵重點 在不同的商業模式、組織需求下會產生差異相當大的 data infrastructure。在第二堂 Live Session 中,我們會嘗試模擬在不同的情境下去規劃大框架下的 data infrastructure 藍圖。 * Analytic-focused data system and operational-focused data system * Components in a data system: ingestion, transformation, storage, and more. 接下來,請在本次 Live Session 開始前,完成以下任務。此調研內容請更新至作業繳交區。 ### 課前任務 #### 任務說明: 以自己公司的 data infrastructure 作為出發點,瞭解 data infrastructure 在不同應用情境可能的變形。在不涉及商業機密的前提,麻煩酌情蒐集現在公司內的下列資訊。此任務結果不會直接對其他學員公開,但建議在課堂中可自願分享與其他人討論。 * 資料來源與種類。Ingestion 的方法 * Backend databases. Snapshot, CDC, or API * Client/Server-side tracking * 3rd-party systems ingestion * Partner data ingestion * Crawler * 目前終端資料如何被使用,如何提供服務。 * Analytics systems * Machine Learning systems * Reporting systems * Reverse ETL * 中間 Data 架構 * Transformation tools. Streaming or batch. SQL or other tools. * Storage * Orchestration * Data discovery * 目前自己公司比較像上述 modern data infra 哪個類型? * 目前日常維運或開發上的痛點、挑戰。 * 未來最期待的變革方向。 * 若把現在 data infrastructure 重來一次,你會做哪些調整? * 以上資訊是否願意在課堂中公開討論? 以上為資訊收集參考框架,不需 100% 符合。另外可參考下方的閱讀清單、參考資訊來整理與搜尋資訊。 課程前必須對 ingestion, transformation, storage, workflow orchestration 等關鍵 components 有足夠的理解與掌握。以及完成必要閱讀。 >#### 作業條件 (for 內部用) >1. 是否為小組作業 (Y/N) N >2. 是否會上傳 url (Y/N), (Miro / google doc) Y >3. 是否須包含課程/ 作業反思 (Y/N), (課程/ 作業) Y >4. 是否可以看到其他人的作業 (Y/N) N >5. 是否會被講師批改 / 回覆 (Y/N) N >6. 其他備註 e.g. 要先等 XX 作業繳交後才能完成此作業 ### 閱讀清單 #### 必要閱讀 * [The Baseline Data Stack - Going Beyond The Modern Data Stack](https://seattledataguy.substack.com/p/the-baseline-datastack-going-beyond) by SeattleDataGuy * The Baseline Data Stack - The Different Types Of Data Stacks - Part 2 ([substack](https://seattledataguy.substack.com/p/the-baseline-data-stack-the-different), [medium](https://medium.com/coriers/the-baseline-data-stack-the-different-types-of-data-stacks-part-2-c6a826d8f2f1)) by SeattleDataGuy (Member-only article) * [Emerging Architectures for Modern Data Infrastructure](https://a16z.com/2020/10/15/emerging-architectures-for-modern-data-infrastructure/) by a16z ### 參考資訊 * [The Modern Data Stack Repository](https://www.moderndatastack.xyz/) ![](https://i.imgur.com/Wxyeudo.png)