• 首頁
  • 關於我
  • 協辦工作坊
  • AI研究論文
  • WordPress 網站範例與指南
  • 教育與學習資源分享
Jyajyun
  • 貓咪事件簿
  • 生活
    • 短期居家喘息服務申請與補助-90歲外公的尿道狹窄術後照顧
  • 關於 焦慮症
    • 從今天起,不再為難自己
    • 如何面對那些刻薄的親戚與朋友
    • 陪家母走過焦慮症的那些小日子
  • Python學習
    • Python 入門學習文件
    • Python 套件模組語法演示與筆記
    • Python技術討論與筆記
  • AI人工智慧
    • 以類神經網路分析隨機 GRY 時間序列模型
    • 神經網路演算法
  • 學習與教育資源分享
    • 教育與學習筆記
    • WordPress 網站範例與指南
    • 優秀的線上演講
    • 家教經驗
    • 國中學習與升學會考策略
    • 助教經驗
    • 協辦工作坊與研討會
  • WordPress 學習指南
Category:

Python 套件模組語法演示與筆記

python套件模組筆記
模組語法繁多複雜
但實際在用的不多,將最核心的內容精熟是最為重要的
其他的內容可以當作理解,在腦海中記錄成索引
當需要時再查閱使用

PythonPython 套件模組語法演示與筆記

Python Selenium 動態網頁爬蟲

by yenchialu 5 1 月, 2022

瀏覽器簡單基本操作

打開瀏覽器+Get網頁

from selenium import webdriver
driver = webdriver.Chrome('./chromedriver')
driver.get("https://www.facebook.com")

上一頁+下一頁+重新載入

#上一頁
driver.back()
#下一頁
driver.forward()
#重新載入
driver.refresh()

滾動網頁

#滑到這次載入的底部,到底部後再往下滑,重複5次
for i in range(5):
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    time.sleep(1)

Selenium定位網站內容

如同人瀏覽網頁時,是針對不同的元素操作,以下是常見的指令

定位指令

  • find_element_by_id
    使用屬性 ID 定位,這是最推薦的定位方法,一個文本裡任何id只會出現一次
  • find_element_by_name
    使用屬性 name 定位
  • find_element_by_class_name
    使用屬性 class 定位
  • find_element_by_link_text
    針對連結標籤(<a href=…>…</a>)
  • find_element_by_xpath
    使用html的語法路徑定位

操作指令

#A是定位位置
#點擊
A.click()
#B是可輸入內容位置
#清空內容
B.clear()
B.send_keys('123')

網站等待載入指令

因為網站載入需要時間,需要給予緩存時間,等待所有東西都載入才可查找、定位或操作。

方法一 : timesleep

比較簡單方式就是在操作前加上timesleep,但因為每個網站載入時間長短不一,這並非最優解。

方法二 : 套件WebDriverWait

"""
格式如下,
WebDriverWait(瀏覽器, 最久等待時間).until(
    EC.presence_of_element_located((By.某個方法, 方法的內容))
)
"""
username = WebDriverWait(driver, 10).until(
    EC.presence_of_element_located((By.NAME, "username"))
)
5 1 月, 2022 0 comments
0 FacebookTwitterEmail

Recent Posts

  • 學霸養成計畫
  • 國中升學體制下學習與應試策略
  • 授女以勇,不求必淑
  • 從零開始也不用害怕的Python學習資源
  • 斯多葛主義 – 練習擱置幻想中的恐懼,接受處境才能直面目標

Recent Posts

  • 學霸養成計畫

    16 10 月, 2023
  • 國中升學體制下學習與應試策略

    16 9 月, 2023
  • 授女以勇,不求必淑

    31 8 月, 2023
  • 從零開始也不用害怕的Python學習資源

    16 8 月, 2023
  • 斯多葛主義 – 練習擱置幻想中的恐懼,接受處境才能直面目標

    9 8 月, 2023

Categories

  • AI人工智慧 (7)
  • Python (20)
  • Python 入門學習文件 (13)
  • Python 套件模組語法演示與筆記 (1)
  • Python技術討論與筆記 (6)
  • Uncategorized (1)
  • WordPress (8)
  • WordPress 問題解決經驗分享 (2)
  • 優秀的WordPress範例網站 (4)
  • 優秀的線上演講 (7)
  • 助教經驗 (2)
  • 國中學習與升學會考策略 (5)
  • 好用插件與小工具 (1)
  • 家教經驗 (7)
  • 後台相關問題 (1)
  • 教育與學習筆記 (19)
  • 書評短筆 (1)
  • 生活 (2)
  • 神經網路演算法 (7)
  • 網路資訊架構 (1)
  • 課程體驗分享 (1)
  • 關於 焦慮症 (5)

About me

banner
很喜歡一代宗師裡的一段話
在我父親身上,我看到的不是招,是意。
慢慢的練習撰寫文字
希望文章不是專業術語的賣弄
而能真正幫助需要資訊的人

Popular Posts

  • 1

    10個使用WORDPRESS 架設新聞媒體和雜誌的網站

    16 11 月, 2022
  • 2

    如何在 Wordpress 添加數學公式

    19 1 月, 2022
  • 3

    激發函數(activation function)的可視化與理解

    22 6 月, 2021

Newsletter

@2019 - All Right Reserved. Designed and Developed by Jyajyun


Back To Top
Jyajyun
  • 貓咪事件簿
  • 生活
    • 短期居家喘息服務申請與補助-90歲外公的尿道狹窄術後照顧
  • 關於 焦慮症
    • 從今天起,不再為難自己
    • 如何面對那些刻薄的親戚與朋友
    • 陪家母走過焦慮症的那些小日子
  • Python學習
    • Python 入門學習文件
    • Python 套件模組語法演示與筆記
    • Python技術討論與筆記
  • AI人工智慧
    • 以類神經網路分析隨機 GRY 時間序列模型
    • 神經網路演算法
  • 學習與教育資源分享
    • 教育與學習筆記
    • WordPress 網站範例與指南
    • 優秀的線上演講
    • 家教經驗
    • 國中學習與升學會考策略
    • 助教經驗
    • 協辦工作坊與研討會
  • WordPress 學習指南