###### tags: `課程筆記`
# Day 1 數位廣告環境現況與數據ETL(Jaton、Neo、 呱吉)
[TOC]
----
## 數據專有名詞

* ==CPC(Cost Per Click)每次點擊成本==:每次消費者點擊你的廣告,你所需要支付給平台的費用
* ==CPM(Cost Per 1000 impression)每千次曝光成本==:每一千個人看到你的廣告,你所需要支付的廣告費用
* ==CPA(Cot Per Action)每次完成行動成本==:讓消費者留下對品牌的實際印象、填寫表格甚至註冊成員會員等,正式進入到你的行銷漏斗中,所要花費的金額。
* PPC(Pay Per Click)點擊付費式的廣告:當消費者點擊以後,業主要付費的廣告類型
* ==CTR(Click-Through Rate)點擊率==(衡量好或不好):人們看到你的廣告並且點擊廣告的比率。比方說,你的廣告曝光了1000次,但看到廣告並且點進去的人只有5個,那麼點擊率就是(5÷1000)×100%= 0.5%
* CVR(Conversion Rate)廣告轉換率:人們點擊廣告以後轉換(成交)的次數。假設有20個人點擊你的廣告,但只有一個人購買你的商品或服務,那麼你的廣告轉換率就是(1÷20)×100%= 5%
* ROI(Return on Investment)投資報酬率:廣告投放的成效,可以簡單地透過「廣告賺了多少淨利潤」,「在廣告投放花了多少錢」計算。比方說你透過廣告為該次的銷售賺得6萬元的淨利潤,在廣告投放上花了2萬元,那麼你的投資報酬率就是[(6-2)÷2]×100%= 200%
---
## 細講DSP、SSP、DMP




---
## 混血數據、來源


PMP
---
## 數位廣告類型


---
## 廣告購買方式
廣告購買方式:Waterfall(買斷) v.s RTB(即時競價)


---
## 域動數據ETL
> ETL,是英文Extract-Transform-Load的縮寫,用來描述將資料從來源端經過抽取(extract)、轉置(transform)、載入(load)至目的端的過程。
ETL=數據流(如何搜集&流程)
使用者進入網頁後,會請求AD Server,來決定要投什麼廣告
第一方Cookie:第一個接觸到User的原始網站
第二方Cookie:別人搜集來的
第三方Cookie:自己埋在網站後台的第三方置入
搜集下來的資料包括:第三方Cookie、時間、版位ID、廣告ID、策略編號、系統、地區、瀏覽器、點擊、曝光、Domain Page、userAgent(身分證)、IP
---
## Holmes系統預覽
### DSP
* 訂單分成:
1. 設定投放時間區間、預算
1. 再來設定策略定向(地區、時段、人口屬性、產業類別、職業族群、興趣類別、消費族群、氣象、裝置、網路環境、媒體、關鍵字)==Google說要看9-12次才會有行為==
1. 投放素材
平台只有大約2-3家代理商使用
* 再來看報表(看廣告成效)
* 站點管理(以企業投放人群為單位,可以拿來做再行銷)
* 自定義人群管理(特定平台、功能的重度使用者等等)
### SSP
客戶進入網站後被貼標:
BT(Behavior Tag過去歷史資訊&標籤)
RT(一進來後就會被貼上去)
### DMP
以公司為單位,來看「到網站的用戶」之
時間、地區、裝置、瀏覽器、興趣、人口屬性、熱門議題、活躍時間熱圖、關注媒體/網站
廣告版位分析
自定義人群、關鍵字人群
> ### DMP的用途,是在看完用戶分析後,再進一步丟到DSP上執行
---
### NLP處理
做了一個很沒用的文字雲_NLP的部分
原本:創List來「排除」不要的字
現在:依照類別來「新增字」
可以來查查CKIP CoreNLP-實體辨識
[CKIP CoreNLP](https://ckip.iis.sinica.edu.tw/service/corenlp/)、[CKIP 中文詞知識庫小組](https://ckip.iis.sinica.edu.tw/demo)
---
### 資料搜集流程


---
## 專案開發前製作業:設定機器
### 教學連結
https://medium.com/@vincent56569050/在gcp上建立jupyter-notebook-de2b6d65a6ea
https://medium.com/程式乾貨/jupyter-notebook-問題-jupyter-command-not-found-a0764d253c65
### 設定機器
STEP1


在開機磁碟按「變更」




連外部時需要-建立IP

要去設定防火牆-用intern的標記連

### 連結機器與Jupyter
做專案前要先建立環境
```
更新套件:
sudo apt update
sudo apt upgrade
安裝 python 3:
sudo apt install python3-dev
#dev會連所有需要的東西都裝一裝
安裝 pip(這裡需要按Y):
sudo apt install python3-pip
更新套件:
sudo apt upgrade
裝 Jupyter 環境:
pip3 install jupyter
將Jupyter加入環境變數:
export PATH=/home/ec891131/.local/bin:$PATH
#「:」後是現有的環境變數,「$」是變數的意思
cd /home/ec891131/.local/bin
#中間要改自己的名字
#檔案前加上.,就會變成隱藏的資料夾(Command Shift+.)
#cd/ #拿來看Root用的、cd~ #回去主畫面
ls
#看List裡面有啥(cd=回到主畫面)
env|grep PATH
#用來看環境變數有啥
(如果沒有設定檔就執行這個):
jupyter notebook --generate-config
用 nano 編輯設定檔:
sudo nano ~/.jupyter/jupyter_notebook_config.py
```
進入防火牆
```
c = get_config()
c.NotebookApp.ip = '*'
c.NotebookApp.open_browser = False
c.NotebookApp.port = 5000
```

```
啟動Jupyter
jupyter-notebook --no-browser --port=5000
```
再來到專案頁面拷貝IP(後面加上:5000)
http://35.201.174.70:5000
進去設定密碼跟貼上Code當中的Token


### 小作業:研究pip到底把檔案裝在什麼地方
https://medium.com/@will.wang/撥開-python-pip-site-packages-的藍色蜘蛛網-90e398bb3785