ChroPath擴展生成XPath及測試抽取
XML Path Language(XPath),是一種在XML文檔中查找信息的語言。而HTML也是用XML格式,所以XPath是非常適用於 HTML 文檔的搜索。而ChroPath就是一款可以生成及測試XPath的瀏覽器擴展。
安裝網址:ChroPath - Chrome 線上應用程式商店 (google.com)
使用方法:
首先按下F12,之後選擇元素,在下方面板會發現多出現了ChroPath的選擇。

在選取區域可以直接用元素面板或是按(1)在然後在網頁選取

選取好就會自動生成XPath,而選取區域也會出現綠色的輪廓

如果想再修改可以選取生成XPath,在輸入框修改XPath,如下面修改了一下把所有的主題都選取,可以看到第一個選取結果是綠色的輪廓,而其他結果是藍色的輪廓。

一些XPath語法:
| 表達式 | 意義 |
|---|---|
| / | 根位置選取 |
| // | 任何位置選取 |
| * | 選取任何元素 |
| div[@id=”id_name”] 或 div[@class=”class_name”] | 選取屬性 |
| div[last()] | 選取最後選取結果 |
| div[contains(@class, ‘path_of_class_name’)] | 選取包含關鍵字的屬性 |
| text() | 選取指定結果的文本 |
在Python網頁爬蟲上,xpath比regex好用不少,不過想再深入用BeautifulSoup會更好,xpath只是在一些自動化程序上可以快捷提取內部做下一步。如用在Selenium 自動化web測試上的按鈕選取。