# Hive
### 主講人:黃夙賢
---
## 甚麼是Hive
- Hadoop的資料倉儲工具,可對HDFS上的檔案資料進行資料查詢和分析處理
- 類似SQL語言的查詢語言
- 可實現簡單的MapReduce統計
- 由Facebook開發
---

##### 參考資料:[[數據分析那些事]](https://allaboutdataanalysis.medium.com/%E5%9F%BA%E6%96%BChadoop%E7%9A%84%E6%95%B8%E5%80%89hive%E5%9F%BA%E7%A4%8E%E7%9F%A5%E8%AD%98-ab063a310fd2)
---

##### 參考資料:[[數據分析那些事]](https://allaboutdataanalysis.medium.com/%E5%9F%BA%E6%96%BChadoop%E7%9A%84%E6%95%B8%E5%80%89hive%E5%9F%BA%E7%A4%8E%E7%9F%A5%E8%AD%98-ab063a310fd2)
---
## Hadoop on Premise
- 協助部屬Hadoop的軟體:MapR、Hortonworks

---
# 利用MAPR Hive
# 玩轉大數據
---
## MAPR
- 全球三大Hadoop開源巨量資料軟體的提供商之一
- Mapr、Hortonwork、Cloudera
- 銷售Apache Hadoop的衍生軟體

---
- 2019年惠普企業(HPE)宣布收購雲端大數據平台服務供應商MapR Technologies ,改名為Data Fabric

---
## MAPR Sandbox
- 提供單機版映像檔,模擬hadoop操作
- 包括Apache Hive

---
## MAPR Sandbox下載
- 下載方式:[google 輸入"mapr6.1 sandbox"查詢](https://package.mapr.com/releases/v6.1.0/sandbox/)
- https://package.mapr.com/releases/v6.1.0/sandbox/
- 或者[google drive](https://drive.google.com/file/d/1rWWdOlGbL9rBRrpmnX-PR3GYP9SyX-wA/view?usp=sharing)
- 虛擬機至少需要6GB的剩餘記憶體

---
## 掛載與連結方式
- 利用Virtual Box掛載下載之Image檔案
- 連結方式
- [http://localhost:8888](http://localhost:8888/)
- ID/PWD: mapr/mapr

---

---
## 前置作業
- 將資料上傳到hdfs中,要記住上傳的hdfs目錄
- 通常就是/user/mapr
---
# Hortonwork Sandbox
---
## Hortonwork
- google輸入 " hortonwork sandbox"
- 下載Hortonwork HDP印象檔

---
## 掛載印象檔並啟動
- 需16G以上之記憶體

---
## 連結至系統設定密碼
- http://localhost:4200
- id:pwd: root/hadoop
- 設定新密碼

---
## 設定ambari登入密碼
- 打入ambari-admin-password-reset
- 輸入帳號admin的新密碼(建議admin)

---
## 連結至Hortonwork
- http://localhost:8080
- 使用admin/新設定密碼登入(admin)

---

---
## Hive介面
- [http://localhost:30800](http://localhost:30800)

{"metaMigratedAt":"2023-06-17T10:19:37.749Z","metaMigratedFrom":"YAML","title":"Hive","breaks":true,"contributors":"[{\"id\":\"ef0225b9-6c2a-4012-82c9-fa1031d2c4db\",\"add\":4085,\"del\":1612}]"}