猴子的記憶庫

因為常常忘記之前的安装和配置過程,所以建立本記憶庫

0%

ChroPath擴展生成XPath及測試抽取

ChroPath擴展生成XPath及測試抽取

ChroPathlogo

XML Path Language(XPath),是一種在XML文檔中查找信息的語言。而HTML也是用XML格式,所以XPath是非常適用於 HTML 文檔的搜索。而ChroPath就是一款可以生成及測試XPath的瀏覽器擴展。

安裝網址:ChroPath - Chrome 線上應用程式商店 (google.com)

使用方法:

首先按下F12,之後選擇元素,在下方面板會發現多出現了ChroPath的選擇。

ChroPath2.png

在選取區域可以直接用元素面板或是按(1)在然後在網頁選取

Xpath2.png

選取好就會自動生成XPath,而選取區域也會出現綠色的輪廓

Xpath3.png

如果想再修改可以選取生成XPath,在輸入框修改XPath,如下面修改了一下把所有的主題都選取,可以看到第一個選取結果是綠色的輪廓,而其他結果是藍色的輪廓。

Xpath4.png

一些XPath語法:

表達式 意義
/ 根位置選取
// 任何位置選取
* 選取任何元素
div[@id=”id_name”] 或 div[@class=”class_name”] 選取屬性
div[last()] 選取最後選取結果
div[contains(@class, ‘path_of_class_name’)] 選取包含關鍵字的屬性
text() 選取指定結果的文本

在Python網頁爬蟲上,xpath比regex好用不少,不過想再深入用BeautifulSoup會更好,xpath只是在一些自動化程序上可以快捷提取內部做下一步。如用在Selenium 自動化web測試上的按鈕選取。