# 2022, IBM CP4D, 北榮, 國網, 產品交流區
## 2022/6/28
Upgrade Successfully CPD4.0.6
1:AutoAI跑6M 1126欄位的實驗會失敗? link
Lab確認fix的版本(4.5.x) limit
2:是否能做input為診斷描述(text)而output為診斷代碼(label)的NLP? link
可以使用Watson Assistant
3:FL若想與高榮(support)一起做 ,要如何進行?
Dev team回覆目前功能無法完全支援北榮所需的case
4:資料不落地的demo
對的人拿到對的資料(Postgresql )
5.Feature 在FL 如何一致
AutoAI輸出Notebook即可同時把Feature匯出
6.S3 connection issue
Version Issue-workaround 北榮內部憑證
Action:
1. [pipeline=>AutoAI](PR framework)
2. 遠端連線(博士) done
3. DB 連線(絳儀)
4. S3問題處理(精誠)done
## 2022/5/13
問題1:AutoAI跑6M 1126欄位的實驗會失敗? [link](https://drive.google.com/file/d/1Q2YKhoqp_9fkTmVtZzzrw7j4KZYilcIf/view?usp=sharing)
A:Lab確認fix的版本(4.5.x)
問題2:是否能做input為診斷描述(text)而output為診斷代碼(lable)的NLP? [link](https://drive.google.com/file/d/1hajRNffuxGF6C8GthYRu3DXlT14uEeAH/view?usp=sharing)
問題3:FL若想與高榮(support)一起做 ,要如何進行?
問題4:資料不落地的demo? TVGH DB is postgresql
## 2021/10/26
問題1:如何畫出feature importance(因為feature已經transform)
回覆1:有計劃改善 時間待定
問題2:AutoAI匯出來的圖如何改存成tiff或jpg
回覆2:圖可以存 table不能
exp history:已在roadmap
UI可以導出notebook -4.0已完成
9/23
問題1:何時會支援NLP?(原嘉)
回覆1:目前沒有Roadmap.
問題2:在做藥物搜索時, 要影像和基因, 請問CP4D, 何時可以支援?(原嘉)3GB 的基因資料,希望可以做癌症期數與病人基因的處置分析:手術/放射/化療的順序。X軸變量是基因,Y是藥物。Drug discovery.
Watson oncology.
Nvidia Dragon 基因定序。
covid-19肺積水的x-ray綜合判斷。影像判讀結果。
Auto AI針對結構化去處理。
回覆2:
問題3:IBM AC922 那麼強, 為什麼CP4D不支援?(原嘉)power9 CPU跟CPD為何不相容?(CPD3.5.1)
回覆3:AutoAI支援的版本請Wang Jun 確認,是否可以混合x86/power9
問題4:為什麼PYTHON程式無法重現 UI的結果呢?(原嘉)
回覆4:send data to Wang Jun
問題5:在PYTHON中, ROC的圖和UI跑出來的圖, UI的圖一直都很漂亮, WHY?(原嘉)
回覆5:
問題6:在Auto AI 的UI中只能跑8個JOB, 超過會當機, 為什麼?(原嘉)
回覆6:1.UI message notice or queue, 有確定會處理但時間尚未確定 M/L是可以的(sean 請補充)
問題7:在AUTO AI中,用PTYHON跑, 已經配了一堆CPU和RAM, 但還是很慢或跑不動(原嘉)
回覆7:
以上議題轉化成以下追蹤清單:
| Issue | Create date| Progress |Notice|
| -------- | -------- | ----------- |------|
| Can not run the notebook generated by AutoAI. Always pending in 27% progress. | 9/3 |1/20 done |9/7 try to make 12vCPU 25Gi take over 24 HR to finish 1/20 demo could run smoothly in 20 minutes (2vCPU 4Gi)|
| Can user access data by name instead of ID. | 9/7 | 1/20 done ||
| When user run multiple jobs, some job will crash | 9/1 | 1/20 done ||
| User can upload training set and testing set separately | 9/1 | TBD |這個功能其實正在開發,IBM internal tracking link: https://github.ibm.com/NGP-TWC/ml-planning/issues/19530 月底的時候雲端版本會更新到notebook會回傳AutoAI 使用哪些 holdout dataset 的功能,下一步就是讓使用者以自行上傳 holdout dataset了。目前此功能尚未決定 release date。
| Can User decide the split? | 1/20 done | 1/20 done |六月已經與產品團隊答成共識,已排入開發roadmap,IBM internal tracking link: https://github.ibm.com/NGP-TWC/ml-planning/issues/24006
| Can user decide fold (default should be 10) | 9/1 | 1/20 done |已申請功能精進|
LSTM有包含在4.0中嗎?
IBM:
有sample code.
VDML(SAS)可以設定跑的時間,去計算最好的流程。時間優先或精度優先 AutoAI也有做這個功能。
IBM:因AutoAI就是先在限定時間內找到精度排序的model 目前沒有這個選項
SAS的template-
IBM:SPSS model are avaliable in CPD4.0.
## 1/20 question:
1.AutoAI可以跑GPU嗎?
2.90%,10%要如何對應到 train/test/validation
3.可以call lib(等北榮安裝後可測)
1.Can AutoAI choose the LSTM model?
A: No, LSTM is not supported yet for regression and classification problem types. Interested to understand what use cases that drives client asking for the LSTM model in the context of AutoAI? Text, time series or something else? This might be helpful for
2.Do we have some use case that run AutoAI in GPU?
A: No, there is timeline for the GPU support for the AutoAI.