Data Strategy Team 2021 Q1

願景:前三個月 infra 後九個月做 growth

Infra 架構(TBD)

img

OKR 四象限

目標 OKR 當前狀況
有個完整的 Infra 可以取用資料,不會有 garbage data 架好 great expectations (data cleaning tool),套用到 big query 上會新增資料的 table zzz%
確保 Facebook Data 的 accessibility zzz%
確保 GA 的 accessibility zzz%
至少一個 function 的人能把資料存進 Warehouse zzz%
有好的團隊氛圍 2週一次分享會 100%
每季跟每個人做一次 1-on-1 100%

例行進度回報(範本)

  1. David Jr.
    • 這兩週:
    • 未來兩週:
    • Blocker:
  2. Lee Wei
    • 這兩週:
  3. Grimmer
    • 這兩週:
    • 未來兩週:
    • Blocker:
  4. Tai
    • 這兩週:
    • 未來兩週:
    • Blocker:
  5. Max
    • 這兩週:
    • 未來兩週:
    • Blocker:
  6. Hane
    • 這兩週:
    • 未來兩週:
    • Blocker:
  7. 睿祥
    • 這兩週:
    • 未來兩週:
    • Blocker:
  8. Jacker
    • 這兩週:
    • 未來兩週:
    • Blocker:
  9. Howard
    • 這兩週:
    • 未來兩週:
    • Blocker:

會議記錄 20210303

分享共筆

  1. David Jr.
    • 這兩週:
    • 未來兩週:
      • 持續約 1-on-1 了解大家的興趣
      • 嘗試把 GA 串起來
      • 嘗試把完成一張 dashboard 的需求給新進組員看,新人可以依樣畫葫蘆~
    • Blocker:Airflow 的 SSL 還在請
  2. Lee Wei
    • 這兩週:
  3. Grimmer
    • 這兩週:
    • 未來兩週:
    • Blocker:
  4. Tai
    • 這兩週:
    • 未來兩週: (同上次)給 rg-cli 加新功能去讀 bigquery 中會眾資料來 render 結案報告
    • Blocker: no (一天只有 24hr qq) (荷蘭要宵禁了 qq)
  5. Max
    • 這兩週:
    • 未來兩週:
    • Blocker:
  6. Hane
    • 這兩週:
    • 未來兩週:
    • Blocker:
  7. 睿祥
    • 這兩週:終於把拖稿的補上了XD
    • 未來兩週:
    • Blocker:
  8. Jacker
    • 這兩週:
    • 未來兩週:
    • Blocker:
  9. Howard
    • 這兩週:
    • 未來兩週:
    • Blocker:

會議記錄 20210217

  1. David Jr.
    • 這兩週:
      • Airflow 的 Google OAuth
      • 整合 Github webhook 到 channel
      • 新增每週 sync 前的 hackmd reminder
      • 跟新朋友約 1-on-1 了解一下大家的興趣和目標
    • 未來兩週:
      • 跟 grimmer, 傑奇、howard、睿祥 約 1-on-1
    • Blocker:
  2. Lee Wei
    • 這兩週:
      • review David's pull request
      • join Tai's github discussion
    • 未來兩週:
      • do we want to upgrade airflow to 2.0? if no one aginst this idea, I'd like to try.
    • Blocker:
      • None
  3. Tai

會議記錄 Template

  • 簡報網址:
  • 講者:
  1. David Jr.
    • 這兩週:
    • 未來兩週:
    • Blocker:
  2. Lee Wei
    • 這兩週:
    • 未來兩週:
    • Blocker:
  3. Grimmer
    • 這兩週:
    • 未來兩週:
    • Blocker:
  4. Tai
    • 這兩週:
    • 未來兩週:
    • Blocker:
  5. Max
    • 這兩週:
    • 未來兩週:
    • Blocker:
  6. Hane
    • 這兩週:
    • 未來兩週:
    • Blocker:
  7. 睿祥
    • 這兩週:
    • 未來兩週:
    • Blocker:
  8. Jacker
    • 這兩週:
    • 未來兩週:
    • Blocker:
  9. Howard
    • 這兩週:
    • 未來兩週:
    • Blocker:

會議記錄 210120

  • 簡報網址:
  • 講者: Hane
  • 今日出席
    • new buddy: 睿祥 Grimmer 瑋明 Howard
    • DavidJr tai Gobby Hane wei stacy
  • self introduction
    • grimmer: 名稱來自動畫 (https://zh.wikipedia.org/zh-tw/MONSTER_(漫畫)),叫 grimmer 或本名康登傑都可以,是 tai lab 學長 (什麼都會)
    • 睿祥: 目前主要做圖像類的Deep learning相關,想了解數據類相關的pipeline或者相關應用。
    • 瑋明 (Jacker): wei 系上學長, 去年有幫忙場務,今年想看看別的
    • Gobby: 在「光和感知」上班,剛來台北半年。暫時沒在寫 code ~~~
    • howard: 去年也幫場務,在台南當工程師做 layer2 switch
    • stacy: SEO 廣告相關公司從業人員
    • tai: 多年志工 來 data 完成「幫 pycontw 量化各種指標」的遺願
    • hane: 資料工程師 莫名身兼 PM 中
    • lee wei: 總召 + 資料工程師,有看懂千年女優
    • david: 前 dcard data engineer,是個一直在做 ETL 清資料的清潔工
  • 組長 announcement
    • 根據上一季 OKR 討論結果,這季 bi-weekly 重點改成分享 + social, 線下再做專案
  • hane 分享對話機器人
  • among us https://play.google.com/store/apps/details?id=com.innersloth.spacemafia&hl=en&gl=US
  1. Max 病假

Hane's Sharing

key words: Dialogflow (company provides API) includes Agent (to bubild intent)

dialogflow.cloud.google.com

OKR Template

  1. 建立願景:

    1. 你現在為什麼想參加 PyCon TW 社群?
      1. david: 想社交;也想學 PM 的技巧
      2. Hane: 習慣(? 想社交,覺得聽大家的經驗分享很有趣
      3. Max: 社交,寫扣
      4. Wei: 遠端工作者需要社交 😆 技術能力不夠 😢 想點一點溝通技能,斜槓一下比較不會被淘汰 😱
      5. tai: 持續增加知識廣度、和人協作寫 code 很有趣(找人一起寫 code)
    2. 你現在大可以參加其他 team,為什麼是 Data Team?
      1. david: 因為本身就是 data engineer,this is my area of expertise
      2. Hane: 感覺可以學到很多沒有接觸過的事物
      3. Max: 學習利用 Data 發揮價值,和接觸平常更多與 Data 相關的事物
      4. Wei: 因為正職是 machine learning engineer ,想來觀摩大大們怎麼做事(但其實我也在其他 team 啦xD)
      5. tai: 想了解相關的專業知識、剛好自己公司也用得到
    3. 你現在希望這個 team 為 PyCon TW 社群做出怎樣的貢獻?
      1. david: 希望讓 PyCon 做到 data-driven
      2. Hane: 讓大家都能方便地找到需要的資訊
      3. Max: 希望利用 Data 讓 PyCon 變得更好
      4. Wei: 減少組長決策壓力
      5. tai: 在數位世界音量夠大、減少決策壓力
    4. 如果現在 Data Team 不存在了,對 PyCon TW 社群有什麼損失?
      1. david: 決策只能拍腦袋,不能用 data 作輔助
      2. Hane: 無法透過過往資訊調整未來方向
      3. Max: 將沒有 Data 可以參考
      4. Wei: 組長決策壓力++ 😢 找未來的組長難度++ 😱
      5. tai: 同上;而且我們會跟其他 PyCon XX 一樣
  2. Giving Feedback: 實名制,用下列格式跟 teammate 說,you should start, stop or continue doing something~

    1. Stop
      1. david: 開會才寫要講的內容~
      2. Hane: 有時候會議時間比較長,可能要控制一下時間(?
      3. Max: 六頂思考帽好長
      4. Wei: 花過多的時間取得或無法取得共識 -> Possible Solution: 先提出 good enough solution 沒反對就可執行
      5. tai: 同上所有人 XD
    2. Start
      1. david: 開會前先把上週進度填完~
      2. Hane: 多花點時間學習&嘗試大家分享的技術
      3. Max: 更多交流,和互相學習,提升開會效率,像是簡化版思考帽 (?)
        1. define 怎樣的問題是用六頂思考帽: xxx
        2. 待 Max proposal
        3. 預先思考,開會就直接做決策
        4. 開會前十分鐘想好發言內容
      4. Wei: 用 reminder bot 提醒大家先填進度(like tag data team at 9:00 p.m.)、用 Project Management tool (like trello) 讓該做的事被明確的追蹤
      5. tai: 大家多送 PR 啦; 或許可以來小專案 sprint
    3. Continue
      1. david: 繼續雙週會跟 OKR 的實體聚~
      2. Hane: 雙週會 & OKR
      3. Max: 更多交流活動,分享會
      4. Wei: 雙週會跟 OKR 頻率kkk、嘗試新工具
      5. tai: 同上所有人 XD
  3. OKR:

    1. 回顧上次的 OKR (use stop, start, continue to optimize our OKR)
    2. 訂這次的 OKR:
      1. 先頭腦風暴(自下而上)
        1. David:
          • 讓大家都能開心的 data team 當志工:Q1 使用 CFR + OKR
          • 引入好的 PM 流程:學會 RICE + scrum
          • 打造團隊透明的文化:一季完成一次 1-on-1
        2. Hane:
          • 學習用 Airflow 定期抓資料
        3. Max:
          • 督促分享會進行 (確認講者、主題、時間)
        4. Wei:
          • 用 great expectations 減少 garbage data (e.g., proposal submission date < 2000-01-01)
          • seo data / fan page message 收進來 -> generalize to fit other purpose (e.g., office site) -> help other team to leverage data infra
        5. tai: data warehouse 和 growth 都想做
          • 實做與維護一到兩個 airflow dag
          • 參與實做與維護 GTM and GA tag,最好是能夠直接操作 GTM/GA dashboard 後直接給 web squad 送 PR 來落實這件事情。
      2. 決定完團隊的 OKR 後再細分到個人(自上而下)
        1. Object: 有個完整的 Infra 可以取用資料,不會有 garbage data
          1. Key Result: 架好 great expectations,套用到 big query 上會新增資料的 table
          2. Key Result: 確保 Facebook Data 的 accessibility
          3. Key Result: 確保 GA (google analytics) 的 accessibility
          4. Key Result: 至少一個 function 的人能把資料存進 Warehouse
        2. 有好的團隊氛圍
          1. Key Result: 2週一次分享會
          2. Key Result: 每季跟每個人做一次 1-on-1
          3. Key Result: 把所有的任務搬到 Trello 上
  4. Action Item:

    1. Facebook 資料串接的 Survey @hane1818
    2. GA 的資料串接 @MaxWu
    3. 研究一下 Web Event Tracking 的串接工具: FullStory @MaxWu
    4. 規劃一下 Infra 的 roadmap @davidtnfsh
    5. 把這些工作搬到 trello 上

1-on-1 固定問題

  1. 你對這一季 data team 的規劃有什麼想法或問題? https://hackmd.io/LLcaglX0Szed-AsHUdC3bg#OKR-Template
  2. 你現在為什麼想參加 PyCon TW 社群?
  3. 你現在大可以參加其他 team,為什麼是 Data Team?
  4. 你現在希望這個 team 為 PyCon TW 社群做出怎樣的貢獻?
  5. 如果現在 Data Team 不存在了,對 PyCon TW 社群有什麼損失?
Select a repo