06_匯率爬蟲

台灣銀行匯率

先在終端機(Terminal)用指定安裝pyquery模組到電腦

!pip install pyquery

簡易爬蟲程式碼

from pyquery import PyQuery

url = 'https://rate.bot.com.tw/xrt?Lang=zh-TW'
html = PyQuery(url)
# 先印出爬蟲抓下來的檔案樣子
# print(html)
# 找到要抓的標籤內容
# <div class="hidden-phone print_show" style="text-indent:30px;">美金 (USD)</div>
name_list = list(html('div.hidden-phone.print_show'))
print(name_list) # 一個儲存物件的清單
# 用dir查看物件可以用屬性名稱有哪些
print(dir(name_list[0])) 

# 買價list
bid_list = html('td[data-table=本行現金買入].rate-content-cash.text-right')
# 賣價list
offer_list = html('td[data-table=本行現金賣出].rate-content-cash.text-right')

for name, bid, offer in zip(name_list, bid_list, offer_list):
    # 使用物件的text屬性取得文字節點內容
    name_cn = name.text.split()[0]
    # 用strip()函數修掉多餘的括號
    name_en = name.text.split()[1].strip('()')
    bid = bid.text
    offer = offer.text
    print(f'幣別:{name_cn} 現金買價:{bid} 現金賣價: {offer}')