數據驅動D2E．創新之際：潛入探索GenAI工作坊

數據驅動D2E．創新之際：潛入探索Gen.AI ⼯作坊 [前置作業](https://hackmd.io/oRJYzxBmTPGPdEkNoeq8Zg) (前置作業步驟只要先做到步驟2即可) 若是有發現選擇Model步驟會有出現錯誤的，可以確認帳號的billing address 是不是在香港或是大陸，可能會有不能選的問題待下午講師看怎麼進行 --- # 主題1：D2E 設計到執行基本概念｜以亞馬遜成功案例與實踐經驗為例產品範疇（Scope）越來越大，一直開發不完應該先定義場景，才開始發展應用準備階段 - 訪談及議題設定階段執行階段 - ＡＩ應用場景設計場景計畫階段 - 需求藍圖階段創新設計的出發點為何？大部分都是老闆說我要做這個->才開始創新在亞馬遜每個業務都必須為了自己事業想辦法創新 > 以服務客戶為出發點逆向工作客戶有不滿意代表有需求，客戶永遠會有不滿意的地方有需求代表有市場這些需求或許不一定可以賺錢，但至少要可以增加客戶黏著度就算是內部系統/App User 也是你的客戶 Amazon 一開始最大的競爭對手其實是實體書店創新來自客戶不滿足的地方季節波動性：賣書不太有季節或是檔期影響->少了更多賺錢的機會但是”百貨“，則會受到這樣波動性的影響為了應付這樣的季節性消費情境，蓋了五千輛車的停車場，有很多冗余的空間中小型零售商可能都還是用人工筆記等，要他們升級或建立系統的話可能是有困難的，開始想將冗余的空間給零售商使用流媒體內容：Kindle、家戶語音重點圖：電子商務成長飛輪 ![160660B2-18A7-4E34-823E-E63BD93BF8DC](https://hackmd.io/_uploads/SkQoBblU6.jpg) 電子商務成長飛輪：一般都由上而下的展開KPI，像魚骨圖，但在AWS是以飛輪的形式業務成長的關鍵要素： 1. 價格 - 先給低價選項，自動評估運費等機制<亞馬遜很多AI都是做在怎麼降低價格 3. 選擇 - 賣家數量是增加消費者的基礎 4. 便利性 - 推出PRIME Member，新商業模式，原來零售可走訂閱模式（Prime用戶消費力是一般的五倍，頻次是兩倍）對於新創來說最重要的是用戶數的成長，而非獲利率等的成長因此需要思考怎麼增加用戶黏著度對於電商來說就是消費者體驗非常重要 ex「找到你要的東西」好的體驗會帶來更多流量，好的流量代表市場露天拍賣比較早開始，但後來大家都改在蝦皮買東西市場在哪，賣家就在哪，故飛輪產生：體驗->流量->銷售賣家->消費者體驗流量導流ＳＥＯ給賣家的服務降價，賣家願意上來，這樣增加商品選擇以後，用戶就會想用當用戶數不夠多的時候，其實是不能考慮成本結構，因為還達不到規模經濟還會分析你是不是價格敏感型消費者 ”雖然我不是數學家，但這看起來很棒對吧“<<全球開店計畫 XDDDDDD 亞馬遜把快速到貨服務變成會員機制， Prime 用戶是非Prime 用戶的消費力有五倍之高，購買頻率則是兩倍以連鎖飲料店作為範例飛輪中的每塊都是可以做進步&創新的機會次要飛輪 ![2CEC3574-7288-4300-8A0D-EFBAF1AD6199](https://hackmd.io/_uploads/B1dXrWgL6.jpg) AI題目這麼多，但提到效益跟成本的評估時，常常會卡在這關百萬Youtube 的秘密， 1. 影片要有趣 1. 要有固定產出，最少兩個禮拜要有一支 1. 每三支要有一支瀏覽數比較高一點 2. [轉換率創新]製造期待感（例如老高：這個題目我們之後會做一支影片跟大家講解、分成上下集） 3. [次要飛輪]獲得第一桶金之後不要直接花掉，而是組成團隊，因為一個人能做的事情絕對比不上團隊能做的事 ![F55A72E2-EC9D-4BE4-AC79-E49986395253](https://hackmd.io/_uploads/SJZqLZeI6.jpg) 因為效益、目標、範疇被固定了，在做創新時比較好找到場景好的設計 1. 本質一致 2. 知道需求範疇在哪裡 3. 對我的客戶影響力創新是小步快跑願意被長期誤解實體書上市例如週五上市大概是3-4天前就到倉庫前一天晚上所有店員加班鋪貨電商則會是週四晚最後一班車出去，為了避免客戶提早拿到。但沒物流中心的小區域則較喜歡去書店購買，避免因物流問題晚收到書電子書可以直接發行就下載怎麼提醒老師要休息XDDDD（他在趕火車了大型創新：單向門；小型創新：雙向門加快創新步伐雙披薩團隊可以有自主權有研究背景因素：超過8個人後溝通成本會呈現指數型上升東方更容易發生小圈圈所以東方一般都說是6-8人，6-8個人是較有效率的溝通團隊單執行緒領導讓雙披薩團隊可以自己發揮 Amazon 扁平化，團隊以橫向擴展，不做縱向擴展創新就是要試驗，而且不可能事先知道試驗能成功或失敗做拍賣網站失敗：不知道價格多少，不知道貨什麼時候收到，可能有人頭帳號炒價，導致使用者體驗過差做Fire手機失敗：沒人想要以消費零售為中心的手機 google 是以助手為中心 Ios以娛樂為中心做Alexa成功：當人不能滑手機的時候要怎麼辦？使用語音逆向工作法顧客至尚關注客戶需要什麼 --- # 主題2：D2E 設計到執行操作探討｜團隊討論與問答 Persona 公車上聽音樂的女生他可能有什麼需求聽想聽的音樂：串流音樂、AI分析喜好音樂降噪：AI分析環境音運算抵銷不想線被拉到：無線耳機交通移動的需求 ![85BFDC6C-71ED-4ADE-9843-490B0E7A609B](https://hackmd.io/_uploads/B1B11GlIp.jpg) 第一層基本分析（基本資訊）客戶描述年齡例如： 25-35歲的上班族第二層環境情境分析（情境需求或面臨的痛點）客戶直接的體驗需求，例如：聽音樂第三層情感/中長期分析（深層/期望的需求）->重點 but 最少被分析到（核心需求）找到這層的需求，才能真的解決問題例如：喜歡聽音樂，串流AI分析聽你喜歡聽的音樂 & 降噪，搭捷運公車太吵逆向工作法：假設你是一個ＡＩ圖片公司，要賣你們家的圖片引擎或服務 -> 應該先定義出客戶才知道你的服務應用情境你的客戶是誰？ 1.SI 2.影視跟遊戲產業 3.零售業內的行銷單位 4.室內設計師 5.殯葬業者 ![566FD525-E989-4397-BCB9-E4A50A42986E](https://hackmd.io/_uploads/HysweMg8p.jpg) 逆向工作法步驟： 1. 傾聽 2. 釐清 3. 創造 4. 完善 5. 測試與改善 Scrum 常見於 4~5 之間，但 Amazon 是 1~5 為什麼PPT不是適合公司提案的好工具？ 1.PPT花最多時間的地方是美工 2.能呈現的內容太少 3.會因為簡報者的差異而導致有吸收差異，例如好的簡報者可以把壞的提案講得很好，反之，壞的簡報者可能讓好的提案不容易被接受 Amazon 常用新聞稿/常見問題作為文體範例，透過這兩種文體做出重點摘要寫文章會檢視邏輯通不通順，需要每件事都很清楚，更能針對想法去討論創新專案的執行流程從新聞稿開始模擬產品成功定義之時，你要呈現的產品功能及目標客戶用以反推需要的資源及開發項目新聞稿（範疇在哪裡？）（摘要）->常見問題（設計&執行細節有哪些？）（老闆、同事問的問題）->視覺呈現（大家確定要做什麼？）（Customer Journey／Wireframe）新聞稿最多2頁喔常見問題常常動輒2,30頁，因為問題會很多ㄏ老闆會問：客戶是誰？ ROI是多少？有辦法收費嗎？有多少資源能投入？需要有什麼額外投資？ UIUX會問：要改變哪些customer journey？wireframe哪些要變更？開發團隊會問：明確需求清單？開發要多少時間？會對現有系統產生什麼改變？ Gen AI要結合進哪些平台內？使用情境在哪？常見問題可以將執行做深，問答可以不斷增加。 so~創新範疇需求不能無限擴大，透過新聞稿定出scope，知道你要開發什麼，**事情可以深化，不要廣化** > 我們閱讀、討論、辯論，並提問專注在執行討論 Design Thinking 設計思考開發人員應該也要閱讀這樣才會知道自己要做的東西到底是什麼，也能避免進開發後又改來改去增加成本想要解決電商運費的問題 1. 先做用戶分群：理性消費者：對價格敏感，但對時間不敏感（理性的消費者不會容易退貨較少即時性物品）感性消費者：對時間敏感但對價格不敏感物流成本對零售商來說是很大的傷痛ＱＱ-> Amazon Prime -> 以業務量提升來降低貨運成本 -> AI 輔助揀貨、出貨、需求量預測等貨架移動到揀貨員面前，所以順序是電腦排的 > 如果不知道最終方案在哪裡，尼會不知道怎麼開發，要開發什麼 Amazon Go:從電商到實體零售的營業模式發想過程 1. 客戶是誰？我們對他們有何了解？ 1. 普遍的客戶問題或機會是什麼？ 1. 解決方案和最重要的客戶利益是什麼？改善零售體驗（過於廣泛）使用點擊支付式信用卡結帳（過於狹隘）使用自助結帳台？（缺乏遠見）已有且無法有效解決排隊（ex ibon還是會排隊）還要賭運氣，看前面的使用者熟不熟悉自助結帳、點餐 1. 如何向客戶說明解決方案？ 1. 如何與客戶一起研究解決方案，探討更好的方向？摒棄所有結帳流程(從源頭解決排隊問題) >>> Amazon Go -> AI Solution（2012開始做，like Tesla，但是他是自駕車） ![39237524-6700-4887-B28A-711A3140C98F](https://hackmd.io/_uploads/rJv9_zeIa.jpg) --- # 工作坊1：GenAI 賦能｜AWS實戰經驗分享 [前置作業](https://hackmd.io/oRJYzxBmTPGPdEkNoeq8Zg) 老師的連結就是這個！ (前置作業步驟只要先做到步驟2即可) 若是有發現選擇Model步驟會有出現錯誤的，可以確認帳號的billing address 是不是在香港或是大陸，可能會有不能選的問題，若不行的但是公司企業有這方面需求的，記得可以找小蟲討論看怎麼樣來合作使用另外一種狀況是個人信用卡帳號，但因為少數用戶會遇到要填寫Model Access 申請資訊的問題，只要填寫完他就會開啟權限可以使用請使用此 [link](https://acciotdatasynctest.s3.ap-northeast-1.amazonaws.com/tw-bedrock-public-workshop.zip?response-content-disposition=inline&X-Amz-Security-Token=IQoJb3JpZ2luX2VjEJT%2F%2F%2F%2F%2F%2F%2F%2F%2F%2FwEaDmFwLW5vcnRoZWFzdC0yIkcwRQIhAI%2FsUdWp1f7YzvZo6hntvHVCsO0jsCKvQ1%2FCd%2BmeAkKUAiBoMwKAmDI5yTugk6dFhjzExsINVUnn2PYe%2FEVV5zamGiqJAwgdEAMaDDA2MjAzODk3NjU2NCIMALRL3ox8rV%2FbK0jrKuYCCvoZBZ7J4trV4SCzurUVIKiWqKWZ8ZIF1HW2ECdOEoQ1OxeBiBhHNA%2BC620gWYRpo82N4ggwMK2NPsMsUDNBlbXgzXqeL2%2F3JoR80BsfLFn5qccqppYZoDIuL%2FYqWjXSKgOeoQT5a7wTlh5YHhuIuAjpVUDitK6C%2Bx2t1Dh4grcrQPQu%2FDN5aCDJJFWNhUNxcWaWd%2BYoTfZY3a9beJKmEiCUxq2ZBQ1%2B5wqDBhtgGfUiShw0PPHUFqCtjiYfmHdFyhEDPoidiQZZ2SvNll%2FQx%2ByzGBvdmXnCSoyLyWX9XwXSHwktEFbcWYd1S946f9ywHH2KpF0xozvBHffwLodiThMBAssKQznP2On%2B38NFtD9mIWwIsfEFaWwkj%2FekbveK3lk8m4MHmrOrW0Q88NubpBN5yzUnbsdSFYXSKqtBpBlClX6%2Fwa6yatpiOqiRraJMpEPX40R6Dnl1lHY%2BlJc2c8%2FP8IZwqzCfo5KsBjqzAn5diG0eevjtiszYv9RbJnZQtBed3mXUUmLQspdFRXLGrouEq%2BBCcNghbAmsByH9A%2Bl3ROpqFFyR4xw76TJYgkSspjLocDQMReXNeRu%2FidfBE%2BebRaojNeD7mTJfeGzhJGgyMPw7fahSr8PH8x0vAQGRGRs%2FVNuk%2BGRKe2CD2ExCRg5GVtv0NkvN%2BHlEzl%2FPypyh%2BwLeMTWrusLgBps3XNdYQksmggOo0GMFFWdikEiqrOe5017yuci9M1bU4um1JgOzqplNFn6RhdebcYRFUYp7yl1dNA282P9QnCkNDEddEOLIP0QNf01M7w%2BLev3bXJx2b%2FbVLWgB8R%2BnYQEUsX%2F6Ln80gDiSw3JG0%2F%2Ftk2hNsCWsu5UsbL5mSlyQlSKlfO1NGOabU17yROvhek6Obxl%2F56Q%3D&X-Amz-Algorithm=AWS4-HMAC-SHA256&X-Amz-Date=20231221T201717Z&X-Amz-SignedHeaders=host&X-Amz-Expires=43199&X-Amz-Credential=ASIAQ44OPVA2GN2SXXMO%2F20231221%2Fap-northeast-1%2Fs3%2Faws4_request&X-Amz-Signature=703b109eec5b0c4d014edb129114788ddcdf33b98a61170231bdaaca07312b3b) 將工作坊筆記本下載到您的電腦。 Amazon Bedrock AIML 架構師一般的機器會忘記自己前面講過的話，所以就需要RAG，才能讓自己的資料或對話能夠有連貫性 RAG：調用自有資料的檢索增強生成先把你的資料存起來，要用的時候他才找得到，但要把這些資料都先變成向量資料，那這個工具就叫做embeded， RAG找不到的原因 1.真的找不到有關連的向量資料 2.有的model理解能力比較不好 Agent代理人：把工具給他，請他整理你要的資訊範例內有做一個股票的Agent, 他會調用外部ＡＰＩ獲取資訊，所以把資料都存到DBchaing，這樣就可以直接問他“今天台積電可不可以買” 他就會直接回你你想要的資訊所以他先幫你預先處理及整合課程結束後，若沒有要繼續測試的話，在老師的前置作業及課程內容內有增加刪除使用中資源的步驟及流程，主要要刪除 1. SagemakerDomain 2. EFS 不過SageMaker有提供免費試用，若是新帳號可以再玩一下下再關 ![messageImage_1702205426552](https://hackmd.io/_uploads/ryb3ueELa.jpg) --- # 工作坊2：數據需求分析 SY Fan (Data Scientist) 資料視覺化：資料落地後需要工具 https://dashboard.eventengine.run/login QuickSight 5000部電影資料集連結 https://reurl.cc/V8OMGy ![截圖 2023-12-11 上午10.55.18](https://hackmd.io/_uploads/S1NV5e4I6.png) ![截圖 2023-12-11 上午10.54.25](https://hackmd.io/_uploads/H1445eEIT.png) 視覺化資訊傳遞流程圓餅圖不適合呈現分組數大於五的資料，圖表會難以一眼識別分組數過多/或是過於平均的資料會建議使用柱狀圖，折線圖：看趨勢or變化呈現的資料量很多，但資訊量很低是不好的呈現方式，但若是想要show off 的話另當別論面積圖與直方圖的差異是什麼？直方圖：區間累積數量，所以他的面積跟高度有意義面積圖則無：就是個顏色（？直方圖Ｘ軸有連續性，長條圖 X 軸為離散資料圖表資料的調色盤：類別型：例如不同組候選人順序型：適用連續資料發散型：可以用來跟過去資料或是看連續性資料的差異性(ex:前後年的溫度差異比較，變冷~變熱) 資料的誤解也是一門藝術，例如2008年賈伯斯刻意使用3D化變形的圓餅圖（？ ![image](https://hackmd.io/_uploads/SyrdzSlLp.png) 關聯不等於因果 ![999E5350-51E5-4DA8-8B3B-EF75511E2A7E](https://hackmd.io/_uploads/BywO7HxIT.jpg) 除了單純傳遞外，資訊要用何種方式解讀也影響呈現方式交互過濾器是各個ＢＩ目前比較重要的功能，先發想問題->了解現有資料，思考要怎麼佐證or什麼邏輯能回答答案？->能更了解資料&呈現方式問題 • 資料集有幾部電影？ (KPI) • 平均電影時長？(KPI) • 整體電影是盈虧情況？(KPI + target value) • 彩色電影與黑白電影的比例？(Pie chart) • 電影發行數量隨時間的趨勢？(Line chart) • 使用者評論的數量分佈？(Histogram) • 拍攝電影數量前10名的第一演員？(Bar chart) • Actor1 Facebook 讚數量與Actor2 Facebook 讚數量的關係？ (Scatter chart) • 不同國家與不同內容分級的電影數量？(Heatmap) • 在地圖上畫出每個國家發行多少不同語言的電影？(Points on map) • 最賺錢的前10 名電影？(Calculated field + Bar chart, Country Filter in USA) 交互式過濾器(Interactive Filter) 1. 開啟一個新的sheet 2. 複製電影發行數量隨時間的趨勢(Line chart) 到新開啟的sheet 3. 開啟互動過濾 4. 增加電影表格 movie_title, title_year, imdb_score 資料觀察實例 1. 取出 Genre 第一個類別，命名為genre_1 (Calculated field) 2. 拉出表格電影資料列表 movie_title, genre_1, title_year, content_rating, movie_facebook_likes, gross 3. Genre_1 與年代呈現的電影平均FB like 數量 (Heatmap) + 互動 4. Genre_1 與分級呈現的票房(Heatmap) + 互動 5. 將先前拍攝電影數量前10名的第一演員圖表(Bar chart) 複製+ 互動發想問題方向 • 善用calculated field 與interactive filter • 人員合作：演員跟演員、演員跟導演 • 電影損益：ROI (若用到電影損益先只考慮USA) • 演員、電影按讚數量與其他變數的關聯 • 探索剛剛沒有介紹到的圖表類型問題範例 • 叫好又叫座的電影？ • 愛自導自演的前10名導演？ • 尼可拉斯凱吉是爛片王嗎？ --- # 如何透過AWS lambda縮短帳務平台巨量資料計算時間帳務資料數量過多 --- # Q&A(若有問題可直接在下方填寫) 1. model理解能力比較不好代表他就是比較弱的模型嗎？那為什麼還需要使用它 2.