# 第一週 大數據分析實務&商業智慧與巨量資料分析 > ==**載入文件、環境架設、快速複習Python 與 課堂規則說明**==[color=#EA0000] ###### tags: `大數據分析實務` `商業智慧與巨量資料分析` `碩士` `複習用` `高科大` >:::spoiler 文章目錄 >[TOC] >::: {%hackmd @chiaoshin369/bigdata_url_temple %} ## 第一周內容 > **時間:2024/2/21(三)** [color=#ffe260] > **2025/2/18(二)、2025/2/20(四)** ### 說明 製作輿情分析網站 課堂每周作業任務、期中期末交網站報告 #### 第一節課內容 介紹輿情分析網站,還有一些趨勢、跟可以獲取到甚麼新知。 > 會學習到 :bookmark_tabs: ==Python== ==爬蟲== ==Django== ==NLP(text2text)== ==Website Design(html+css+js)== ==ML&DL== ==MLP、CNN== ==LLM api==[color=#ffe260] #### 課堂評分方式 ![image](https://hackmd.io/_uploads/r10OT-VqJx.png) ![image](https://hackmd.io/_uploads/B1ExCbN9kl.png) > 規定一個人自己完成一個專案(可以互相討論、使用LLM工具)。 #### 第二節課內容 >[!Important] > **基礎Python快速review。 學習使用 ==jupyter notebook== (.ipynb)** 可以使用colab執行,但老師希望大家,直接下載老師的範本檔案,在本地端用vscode執行。 ##### STEP 1. 在C槽 **文件** 夾內,新增一個資料夾,名為bigdata 2. 將老師範本檔案,放進資料夾內 3. 使用VSCode開啟 (可以在終端機cmd 輸入`code .`開啟) ### 回家作業-環境架設 #### 下載檔案 >[!Note] >選取 w01 所有檔案 download。 ![image](https://hackmd.io/_uploads/BJzEWIpq1e.png) 如果 **無法使用** 或 **檔案連結已被老師變更**,請至 `Github倉庫` 下載 >[!Important] >[bigdata/2025/class1 at main · chiaoshin/bigdata | Github倉庫下載連結](https://github.com/chiaoshin/bigdata/blob/main/2025/class1/drive-download-20250227T020304Z-001.zip) >![bigdata_download](https://hackmd.io/_uploads/SkkCsBa9Jx.png) #### 軟體與環境安裝 STEP BY STEP 1. 使用 [VSCode編譯器](https://code.visualstudio.com/) 2. 下載 [Python 版本3.10.6(以上)](https://www.python.org/downloads/release/python-3106/) 3. 安裝 [MiniConda3 | 可下載最新版](https://repo.anaconda.com/miniconda/) 後續需建立虛擬環境,可參考 [文章後方MiniConda安裝教學](https://hackmd.io/@chiaoshin369/LearnDjangoPython_1#%E9%A1%8D%E5%A4%96%E6%8E%A8%E8%96%A6%E4%BD%BF%E7%94%A8%E8%BB%9F%E9%AB%94) 4. [安裝 老師提供之 Python環境套件](https://hackmd.io/@chiaoshin369/LearnDjangoPython_1#%E5%AE%89%E8%A3%9D%E8%AA%B2%E5%A0%82%E5%BF%85%E8%A6%81-Python%E5%A5%97%E4%BB%B6) #### 最後,請開啟檔案 <br><br>`00-Python introduction-very simple version.ipynb` <br><br> 學習如何使用 python :::danger :warning: 注意 ! ! ! 老師會在第一週教學python的基礎用法,但建議還是要有一定基礎,再來修課會比較合適。 ::: ##### 點擊,檔案右上角 **Select Kernel** 選擇 **Python的環境** Ex. ai25(Python 3.10.12) ![image](https://hackmd.io/_uploads/r17xBLp5ke.png) ![image](https://hackmd.io/_uploads/H1OqMUaqyx.png) >[!Note] > 如果你有其他環境,可以這樣切,就能使用其他專案之環境。 >![image](https://hackmd.io/_uploads/SJqQBI6cyl.png) > >![image](https://hackmd.io/_uploads/HyWUB865Jg.png) ##### 開始執行 `jieba`,最終產生 Frequency count(計算關鍵字出現次數) 此為2024年老師教學之內容,約第3週才會碰到斷詞與詞彙分析,此檔案開啟方式可忽略。 ![image](https://hackmd.io/_uploads/SJPpFvZkC.png =500x500) :::warning > **Python版本控制**[color=#ffe260] 可以使用一款軟體 **`Scoop`**,去安裝要使用的多個版本的python,並用 `scoop reset python版本` (Ex. `scoop reset python310`) 來切換版本,最後再用 `python -V` 查目前切換的版本。 ```powershell # 搜尋 python 版本 scoop search python # 安裝 python 3.10以上版本 scoop install python 310 # 如果有多個python版本,可下指令進行切換 scoop reset python310 # 最後查看目前python版本 python -v ``` 參考文件: * [Windows 套件管理工具 - Scoop:叡揚部落格](https://www.gss.com.tw/blog/windows-%E5%A5%97%E4%BB%B6%E7%AE%A1%E7%90%86%E5%B7%A5%E5%85%B7-scoop) * [通过Scoop安装和切换Java(JDK)、Python、Ruby的版本 – 就是这个范儿](https://www.thisfaner.com/p/install-and-switch-versions-of-java-python-ruby-via-scoop/) * [Unable to install older versions of python using scoop · Issue #313 · ScoopInstaller/Versions](https://github.com/ScoopInstaller/Versions/issues/313) ::: #### 額外推薦使用軟體 > **==terminal==**[color=#9751bc] > >![image](https://hackmd.io/_uploads/S1V_qvZ1A.png)[color=#9751bc] >[Windows Terminal - 在 Windows 上免費下載並安裝 | Microsoft Store 安裝載點](https://apps.microsoft.com/detail/9n0dx20hk701?hl=zh-TW&gl=TW) > >[microsoft/terminal: The new Windows Terminal and the original Windows console host, all in the same place! | github官方開源介面與載點](https://github.com/microsoft/terminal) > >[老師安裝教學_Powershell usage and installation(Optional) - Google 雲端硬碟](https://docs.google.com/document/d/1sm4h4c4Qq4aU93ZmZ8Mw8niKzLpprSvL/edit?usp=drive_link&ouid=106556911165853690236&rtpof=true&sd=true)[color=#9751bc] >[profile.ps1 載點 | 自動斷行](https://drive.google.com/file/d/1soicuYnkBkHrj4i57Fh1E76neijfss6G/view) > >[參考文章:美化 Terminal |Windows - Windows Terminal - HackMD](https://hackmd.io/@cmrdb/BJkcq5AiK) >[!Tip] >可以使用 `Scoop` 安裝開源軟體。 >![image](https://hackmd.io/_uploads/BkxKvfEqkg.png) > **MiniConda3**[color=#ffe260] > [老師安裝教學_miniconda | Google 雲端硬碟](https://drive.google.com/file/d/1szHqCh6VDFyYqPtbw6HMKxAvtbc6oOr3/view?usp=drive_link) > 一樣使用 **`Scoop`** 安裝。[color=#ffe260] > ```scoop > 尋找是否有miniconda > scoop search miniconda > > 下載其中一個符合課堂所需的版本 > scoop install miniconda3-4.12.0 > ``` > ![image](https://hackmd.io/_uploads/H1GEzOWkA.png =350x200) > > 安裝完成,在windows搜尋則會找到 `Anaconda Prompt` > 終端機介面(cmd、powershell) > > ![image](https://hackmd.io/_uploads/Hyfqzu-JR.png =300x200) ##### 利用 `MiniConda`,創建 ==虛擬環境== 防止每個專案使用的套件,版本不會污染到本機的其他檔案。 ```powershell=1 conda env list 查看虛擬環境 conda create -n ai24 python=3.10 新增名為ai24的虛擬環境 conda activate ai24 啟動虛擬環境 conda deactivate 退出虛擬環境 conda env remove -n ai24 刪除名為ai24的虛擬環境 conda init powershell 初始化 pip list 確認環境的套件安裝 ``` >[!Note] >今年為 2025 (113-2),則改為新增 ==ai25== 虛擬環境 > >```powershell >新增名為ai25的虛擬環境,並同時安裝python版本3.11 >conda create -n ai25 python=3.11 > >啟動虛擬環境 >conda activate ai25 >``` >[!Tip] >在 PowerShell **反白選起來**,等於 **複製貼上**,不用使用快捷鍵(ctrl+c、ctrl+v)處理。 #### 安裝課堂必要 Python套件 [10-10-requirement-2024.txt載點 | Python packages we have to install - Google 雲端硬碟](https://drive.google.com/file/u/1/d/1t1cZc5Ny8tnVGvTrHPLJjlyBhkTFoBYo/view?usp=drive_open) ```powershell 安裝所有套件環境 pip install -r 10-10-requirement-2024.txt 絕對路徑安裝(此為舊版安裝檔) pip install -r D:\nkust\bigdata\10-10-requirements-2023 ``` >[!Note] ><font color="#EA0000">**相對路徑安裝**</font> >今年為 2025 (113-2),則改為 `10-10-requirements-2024.txt` 安裝檔。 >```powershell=1 >cd D:\nkust\bigdata2025 自行新增資料夾,並切入路徑 >pip install -r .\10-10-requirements-2024.txt 安裝所有套件環境 >``` #### 安全機制權限 調整PowerShell的權限,就能執行腳本。 ```powershell=1 Set-ExecutionPolicy RemoteSigned 設定 執行原則 Get-ExecutionPolicy 確認目前 執行原則 ``` **「執行原則」** 有下列 4 種: 1. Restricted :關閉腳本檔的執行功能,這是預設的設定值。 2. AllSigned :只允許執行受信任發行者簽署過的腳本檔。 3. RemoteSigned :在本機電腦所撰寫的腳本檔,不需要簽署就可執行;但是從網際網路(例如:email、MSN Messenger)下載的腳本檔就必須經過受信任發行者的簽署才能執行。 4. Unrestricted :任何腳本檔皆可被執行,但是於執行網際網路下載的腳本檔時,會先出現警告的提示視窗。 ![image](https://hackmd.io/_uploads/HJLhodWy0.png =900x200) :::success 下次執行 **powershell** 時,自動載入虛擬環境。 ::: #### VSCode 載入 PowerShell ![image](https://hackmd.io/_uploads/rJRNTuWJC.png) ##### 安裝其餘套件 繼續安裝延伸套件(Plugin): 1. ==Python—by Microsoft== (three extensions will be installed) -Pylance: A performant, feature-rich language server for Python in VS Code -Jupyter -Black Formatter Python formatter 2. ==Live Server== (local server for dynamic pages) 3. **Django by "Baptiste Darthenay"** Django code formatter 4. ==Prettier - Code formatter==(Beautify javascript, JSON, CSS, Sass, and HTML in Visual Studio Code.) 5. ==Auto Rename Tag== by Jun Han(自動重命名配對的HTML / XML標籤) #### 到 VSCode 設定 ==自動存檔== ![AutoSave](https://hackmd.io/_uploads/BkYo7QN51g.png =250x500) - [x] File>AutoSave 自動存檔 勾選 ### 執行檔案 開啟資料夾10-05(w02-35) 繁體中文斷詞 載入模型,進行斷句。 --- :::spoiler 最後更新日期 >==第一版==[time=2024 3 27 , 7:30 PM][color=#786ff7] >第二版[time=2025 2 18 , 12:10 PM][color=#ce770c] >第三版[time=2025 2 20 , 11:39 PM][color=#d1a93c] <!-- >第四版[time=2025 2 20 , 12:00 PM][color=#ffe260] --> >**最後版[time=2025 2 20 , 12:00 PM]**[color=#EA0000] :::