# VMware Skyline Health Diagnostics(SHD)使用 - Part1: 安裝及界面 ###### tags: `skyline` `vmware` [toc] # SHD 是什麼? **VMware Skyline Health Diagnostics**(以下簡稱 **SHD**)是**自助服務診斷平台**。此工具可協助偵測 vSphere 和 vSAN 產品線中的問題,並為其提供解決方案。 VMware Skyline Health Diagnostics 工具使用產品記錄檔來檢視問題,並以知識庫文章或問題修復程序的形式提供建議。管理者可在連絡 VMware 全球支援服務(GSS)之前,使用此工具先行進行故障問題排除。**SHD 工具免費提供取用**。 :::info **Skyline advisor** 和 **Skyline Health Diagnostic(SHD)** 有何區別? - Skyline Advisor [[**資訊**]](https://www.vmware.com/tw/support/services/skyline.html) 是由 VMware 託管的網站服務,而 SHD 是地端(on-prem)解決方案,不需要有雲端帳戶。 - 兩種產品提供的功能有所差異。 - Skyline advisor 是一種主動分析工具。 - SHD 是被動的、基於症狀並專注於日誌分析和建議。 ::: :::success **Skyline Health**? - [Introducing VMware Skyline Health for vSphere](https://blogs.vmware.com/vsphere/2019/11/introducing-vmware-skyline-health-for-vsphere.html) ![](https://blogs.vmware.com/vsphere/files/2019/11/SkylineHealth_FeatChart.png) - [Check health of the system using Skyline Health for vSphere](https://docs.vmware.com/en/VMware-vSphere/7.0/com.vmware.vsphere.monitoring.doc/GUID-612FD656-5C18-4F89-80A5-3A01E89E0FB6.html) - **必要條件** - **必須**參與「客戶經驗改進計劃(CEIP)」,才能使用線上健全狀況檢查。 - 若要執行線上健全狀況檢查,vCenter Server 必須能透過網際網路進行通訊。 - 在 Web Client 中選取 vCenter/ESXi,點選 **Monitor** > **Skyline Health**,便能迅速檢視整體 vSphere 環境的健康狀況。**真的是很簡便的管理功能**。 ![](https://i.imgur.com/2SDI5MW.png) - 問題排除 - 若出現 "`Unable to query vSphere health information. Check vSphere Client logs for details.`" 錯誤訊息。 ![](https://i.imgur.com/paawIuE.png) 請連線至 vCenter VAMI(port:5480),選擇 **Services**,啟用 **VMware Analytics Service**。並回到 Web Client 中的 Skyline Health 執行 **RETEST**。 ![](https://i.imgur.com/I3fqUKd.png) - 確定互聯網連線正常,也加入了 CEIP,但顯示 "`Could not execute Online health checks`" 錯誤訊息。 ![](https://i.imgur.com/yAoTZ6e.png) 目前為 vCenter Server 7.0 Update 3d 版本已知問題,請參考 [[VMware KB#88254]](https://kb.vmware.com/s/article/88254) ::: ## SHD 優勢 - 根據症狀提供知識庫文章或修復步驟來解決問題。 - 自助服務縮短了獲得解決問題建議的時間。 - 快速推薦有助於基礎設施從故障中恢復,並確保業務運行的中斷時間減少。 ## 運作架構 SHD 需要佈署成虛擬設備。當佈署環境遇到 VMware 產品問題時,便可收集日誌包並使用 SHD 執行分析作業。該診斷平台具有許多特徵值(signature)進行問題檢測。當特徵值與日誌文件中的訊息相符時,管理者將會收到通知: - 有關特徵相符的資訊 - 解決問題的補救步驟或知識庫文章 VMware 每兩週發布一次特徵值,管理者可下載這些更新的特徵值。 如果插件運行成功或失敗,CEIP 程序會收集信息。它將這些數據發送到 VMware 雲以提高問題檢測能力。 ![](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/images/GUID-EC151E45-0668-4160-9387-CBCCF1708C3B-low.jpg) ## SHD 使用對外端口 | Purpose | Destination URL | Protocol | Destination Port| | --- | --- | --- | --- | | Download the new patches and updates | https://shd-download.vmware.com | HTTPS | 443 | | Download the VMware Compatibility Guide updates | https://vmware.com | HTTPS | 443 | | vSAN Hardware Compatibility | https://partnerweb.vmware.com | HTTP | 80 | | Customer Experience Improvement Program | https://vcsa.vmware.com | HTTPS | 443 | ## 支援 VMware 產品 - Supported vSphere Releases - VMware ESXi version 6.5, 6.7 and 7.0 - VMWare vCenter version 6.5, 6.7 and 7.0 - Supported vSAN Releases - VMware vSAN version 6.5, 6.7 and 7.0 - Supported VMware Cloud Foundation Releases (Technical Preview Mode) - VMware Cloud Foundation version 4.0, 4.1, 4.2 and 4.3 # 佈署 SHD ## 需求環境 - **軟體** 佈署 OVA 需提供 VMware vCenter Server 6.5(含)以上版本。 - **硬體** 虛擬設備預設組態: - 4 vCPUs - 16 GB RAM - 250 GB 磁碟空間 - 可存取 ESXi/vCenter/vSAN 網路的連接埠群組 - **網路** 提供需要為其進行診斷 vSphere 基礎架構連接的網路環境。並滿足以下要求: - 部署在 IPV4 網路並具有有效的 IP 地址(靜態或 DHCP) - 能夠連線至 vCenter 及其所管理的所有 ESXi 主機(預設埠: 443) - 若需要分析斷開連接(disconnected)的 ESXi 主機,請確認能夠透過 SSH(埠:22)連接到 ESXi 主機 - 若需要分析 VCF 環境,請確認能夠連線至 VMware Cloud Foundation SDDC Manager(預設埠: 443) ## 進行 OVA 佈署 ### 準備 OVA 映像檔 先從 VMware 產品下載網站下載 VMware Skyline Health Diagnostics OVA 映像檔 [[連結]](https://customerconnect.vmware.com/downloads/get-download?downloadGroup=SKYLINE_HD_VSPHERE)。目前**最新版本 3.0.2(釋出日期: 2022-03-24)**。 ![](https://i.imgur.com/4EHKikD.png) :::info - 目前 SHD 提供 **OVA 映像檔**及 **ISO 檔**進行佈署。 - 若是全新佈署,採用 OVA 映像檔完成一步安裝的流程,成功佈署後即可使用 SHD。 - SHD ISO 檔則可應用於離線升級既有 SHD 或安裝(需要先安裝 Photon OS)。 ::: ### 使用 OVFTool 及 Ansible 進行安裝 使用這種方式進行安裝已經算是習慣了。準備以下組態檔和劇本檔後就可以進行佈署作業了。 #### shd_config.yml ```yaml= --- # information for avicontroller shd_ovftool: "/usr/bin/ovftool" shd_vmname: "SHD1" shd_datastore: "shared_datastore02" shd_disk_mode: "thin" shd_network: "VM Network" shd_ipaddress: "10.7.160.178" shd_prefix: "24" shd_gateway: "10.7.160.254" shd_dns: "10.7.160.21" shd_ntp: "time.google.com" shd_rootpassword: "VMware1!VMware1!" shd_adminpassword: "VMware1!VMware1!" shd_poweron: true ## nfs shd_ova_location: "/mnt/ovaPath/vmware_ova" shd_ova: "VMware-Skyline-HealthDiagnostics-Appliance-3.0.2-19537731_OVF10.ova" # information for vcenter server or esxi host mgmt_vc: "vc.khdc.local" mgmt_vc_username: "administrator@khdc.local" mgmt_vc_password: "VMware1!VMware1!" mgmt_vc_port: "443" mgmt_vc_datacenter: "KHDC" mgmt_vc_cluster: "MANAGEMENT" esxi_host: "10.7.160.13" shd_removelist: ["SHD1"] ``` #### shd_deploy.yml ```yaml= --- - hosts: local gather_facts: false connection: local tasks: - name: '讀取預設參數' include_vars: shd_config.yml - name: '佈署 Skyline Health Diagnostics Applicance' shell: > {{ shd_ovftool }} '--name={{ shd_vmname }}' --X:injectOvfEnv --acceptAllEulas --allowExtraConfig --skipManifestCheck --noSSLVerify '--datastore={{ shd_datastore }}' '--diskMode={{ shd_disk_mode }}' '--net:VM_Network={{ shd_network }}' '--prop:root-password={{ shd_rootpassword }}' '--prop:shd-admin-password={{ shd_adminpassword }}' '--prop:hostname={{ shd_vmname }}' '--prop:netipaddress={{ shd_ipaddress }}' '--prop:netprefix={{ shd_prefix }}' '--prop:netgateway={{ shd_gateway }}' '--prop:netdns={{ shd_dns }}' '--prop:netntp={{ shd_ntp }}' '--powerOn={{ shd_poweron | string }}' '{{ shd_ova_location }}/{{ shd_ova }}' 'vi://{{ mgmt_vc_username | urlencode }}:{{ mgmt_vc_password | urlencode }}@{{ mgmt_vc }}/{{ mgmt_vc_datacenter }}/host/{{ mgmt_vc_cluster }}/{{ esxi_host }}' - name: '進行 SHD 虛擬設備第一次快照' vmware_guest_snapshot: hostname: "{{ mgmt_vc }}" username: "{{ mgmt_vc_username }}" password: "{{ mgmt_vc_password }}" validate_certs: false datacenter: "{{ mgmt_vc_datacenter }}" folder: "/{{ mgmt_vc_datacenter }}/vm/" name: "{{ shd_vmname }}" state: present snapshot_name: snapshot1 description: "snapshot for SHD via Ansible" delegate_to: localhost - name: '等待 SHD 虛擬設備上線' uri: url: "https://{{ shd_ipaddress }}" status_code: 200 validate_certs: false register: result until: result.status == 200 retries: 600 delay: 60 ``` #### shd_remove.yml ```yaml= --- - name: '使用 Ansible 進行 VMware SHD VM 移除作業' hosts: local gather_facts: false connection: local tasks: - name: '讀取預設參數' include_vars: shd_config.yml - name: '移除虛擬主機' vmware_guest: hostname: "{{ mgmt_vc }}" username: "{{ mgmt_vc_username }}" password: "{{ mgmt_vc_password }}" name: "{{ item }}" validate_certs: false state: absent force: yes delegate_to: localhost with_items: "{{ shd_removelist }}" ``` 使用 **`andible-playbook -vvv shd_deploy.yml`** 命令,接著就可以泡杯 :coffee: 稍等幾分鐘,等待 Ansible 自動完成 SHD 虛擬設備佈署、快照及連線確認等相關作業。 ![](https://i.imgur.com/4ckq7SV.png) # SHD 基本界面操作 ## 首次登入 連線確認完成後,使用瀏覽器連線 SHD 的 FQDN 或是 IP 位址,登入帳號為 **`shd-admin`**。 :::info - **`root`** 帳號屬於系統(Photon OS)帳號。 - **`shd-admin`** 帳號是 SHD 的第一組管理帳號。 ::: ![](https://i.imgur.com/Nj22RC3.png) :::danger **注意** 若登入後顯示 **VMware Skyline Health Diagnostics for vSphere - First Boot Password Manager** 頁面。表示在佈署時為 **root** 和 **shd-admin** 指定的**密碼強度不足**造成。只要按照頁面完成密碼重新配置再重新連線登入即可。 ![](https://i.imgur.com/qvX6cpz.png) ::: 正確驗證帳號並登入後,將會進行 EULA & CEIP 配置。 - **使用者授權合約(EULA)** ![](https://i.imgur.com/XK3pBbB.png) - **客戶體驗改善計畫(CEIP)** SHD 產品參與 CEIP 計畫,可透過傳送匿名訊息至 VMware 以取得最新問題的檢測和建議,提高使用 VMware 產品和服務的質量、可靠性和功能。**參與 CEIP 為預設選項**。 ![](https://i.imgur.com/wtCCW9d.png) **建議參與 CEIP**,但此項目為**可選擇性**,隨時可加入或退出計畫 <img width=480 src=https://i.imgur.com/6e5SXrp.png> :::info 對於 CEIP 計畫的信任與保證(Trust and Assurance),可 [**連線檢閱**](http://www.vmware.com/trustvmware/ceip.html) 進一步相關資訊。 ::: ## 操作界面 SHD 上方提供 4 組功能選項,點選該選項卡可迅速切換所需功能。 ### 分析診斷(Analyze) - 直接連線到 vCenter 或 ESXi 執行分析診斷。[[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-FE866386-71D1-457F-9FF5-003755DE8104.html) :::info - 除了 vSphere 環境,也可連接 VCF SDDC Manager 進行 VCF 環境的分析診斷。[[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-5C3E10BA-FA67-4343-8E2B-1D36F3C43B57.html) - 連接 vCenter 取得 vSAN 叢集環境的分析診斷。[[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-46E52CF8-2CEC-4FB3-8626-2FE4D2BF1844.html) ::: - 手動上傳和分析日誌包(Log Bundles)。[[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-897D3C98-20D0-4661-AF46-527A21CCBAEB.html) :::info SHD 3.0.1(含)以上版本可分析支援的日誌包 - ESXi 版本 6.5、6.7 和 7.0 的診斷日誌包。 - vCenter 版本 6.5、6.7 和 7.0 的診斷日誌包 - vCenter 版本 6.5、6.7 和 7.0 安裝失敗、升級或遷移的日誌包。 ::: ![](https://i.imgur.com/IdojhNt.png) ### 顯示報告(Show Reports) - 以報告的形式查看分析結果 - 查看過去 50 次所執行的分析訊息 - 左側選單顯示 5 種報告過濾器: - Diagnostics - VMSA(VMware Security Advisory) - vSAN-HealthCheck - VCG Check(VMware Compatibility Guide) - VMware Cloud Foundation ![](https://i.imgur.com/2UCvHQ2.png) ### 配置管理(Settings) 提供 SHD 使用者管理、更新及組態調整等功能選項。 ![](https://i.imgur.com/eDEnlwQ.png) 左側選單提供以下項目: - 升級和歷史紀錄(Upgrade & History) > 查看 SHD 和 VCG 升級資訊及歷史更新日期 [[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-411FA651-851D-4329-A8FE-65E14069BE0B.html) - 客戶體驗(CEIP) > 查看互聯網連線狀態、CEIP 狀態和 CEIP 收集資料範本 [[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-C7DAA309-C05F-4F8B-B022-C3FD8CA3643E.html) :::info 若想了解 SHD 參與 CEIP 所收集數據的詳細訊息,可以參考此處 [[**工具使用報告(Tool Usage Report)**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-9CCA4CF3-76EC-4F63-B2CD-F87D51C42127.html) ::: - 用戶管理(User Management) > 建立和編輯本地用戶資訊 [[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-24803777-117F-4D8F-B51C-7B04E0E1FE3D.html) - 設備組態(Configurations) > 提供 SHD 設備組態調整,以獲得更好的用戶體驗和性能 [[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-38BDFE8D-9670-4E57-9F60-AFA3C35F6037.html) - 重置密碼(Reset Password) > 變更 **`shd-admin`** 密碼 [[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-962593EF-F3A3-44F4-ADF9-797E19597D96.html) - 代理設定(Proxy Settings) > 互聯網連線設定 [[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-1440DEB9-A080-408C-AD34-6F234958D743.html) - 幫助和支持(Help & Support) > VMware 對於 SHD 工具的協助資源 [[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-A3F7043E-33EB-4E31-AA4F-E0E18130E2F8.html) - 關於(About) > 版本訊息、運行時間和硬體使用資源 ![](https://i.imgur.com/FcEP8UX.png) ### 調度排程(Scheduler) 若希望經常性地安排掃描環境以確保健康。若發現問題,也能產生報告,以便可以針對問題立即解決或安排計畫處理。可以透過調度排程功能來達成上述需求。[[**資訊**]](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-3B812466-3848-48EC-AF91-0D18A1997000.html) ![](https://i.imgur.com/pdozRV1.png) --- 以上就是簡單的 SHD 安裝及界面介紹。後續有時間再分享 SHD 分析診斷的使用方式吧 - [Part1: 安裝及界面](https://hackmd.io/@farmer87/shd_01) - [Part2: 功能操作](https://hackmd.io/@farmer87/shd_02) - [Part3: 報告排程](https://hackmd.io/@farmer87/shd_03) - [Part4: API 使用](https://hackmd.io/@farmer87/shd_04) # 參考資訊 - [VMware SHD Release Note](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/rn/VMware-Skyline-Health-Diagnostics-Release-Notes.html) - [VMware SHD Installion, Configuration and Operations Guide](https://docs.vmware.com/en/VMware-Skyline-Health-Diagnostics/services/Skyline-Health-Diagnostics/GUID-ED9B9FB1-FE2B-498E-BBD0-1AB28E3F873F.html) - [VMware Skyline Health Diagnostics for vSphere - FAQ (81931)](https://kb.vmware.com/s/article/81931) - [VMware vSphere Blog - Introducing VMware Skyline Health Diagnostic Tool](https://blogs.vmware.com/vsphere/2020/09/introducing-vmware-skyline-health-diagnostic-tool.html) - [Youtube - VMwareKB: SHD Install(OVA)](https://youtu.be/IQPVWzF5fAE) - [Youtube - VMware vSphere - Install SHD(ISO)](https://youtu.be/rBZuBINtcAM) - [Youtube - VMware vSphere - SHD](https://youtu.be/nxCSuH2DbwE)