做爬蟲總會遇到各種各樣的反爬限制,反爬的第一道防線往往在登錄就出現(xiàn)了,為了限制爬蟲自動登錄,各家使出了渾身解數(shù),所謂道高一尺魔高一丈。
今天分享個如何簡單處理滑動圖片的驗證碼的案例。
類似這種拖動滑塊移動到圖片中缺口位置與之重合的登錄驗證在很多網(wǎng)站或者APP都比較常見,因為它對真實用戶體驗友好,容易識別。同時也能攔截掉大部分初級爬蟲。
作為一只python爬蟲,如何正確地自動完成這個驗證過程呢?
先來分析下,核心問題其實是要怎么樣找到目標(biāo)缺口的位置,一旦知道了位置,我們就可以借用selenium等工具完成拖動的操作。
我們可以借用opencv來解決這個問題,主要步驟:
opencv 是什么?
OpenCV(Open Source Computer Vision Library)是開放源代碼計算機(jī)視覺庫,主要算法涉及圖像處理、計算機(jī)視覺和機(jī)器學(xué)習(xí)相關(guān)方法,可用于開發(fā)實時的圖像處理、計算機(jī)視覺以及模式識別程序。
直接安裝
首先將圖片進(jìn)行高斯模糊處理,高斯模糊的主要作用是減少圖像的噪聲,用于預(yù)處理階段。
處理后的效果
接著用Canny邊緣檢測到得到一個包含“窄邊界”的二值圖像。所謂二值圖像就是黑白圖,只有黑色和白色。
輪廓檢測
找出所有的輪廓,并用紅色線框?qū)⑵淅L制標(biāo)識出來了,看出來大大小小有幾十個輪廓
剩下的問題就好辦了,我們只需要對輪廓的面積或者周長范圍做限制,就能過濾出目標(biāo)輪廓的位置, 前提是我們對目標(biāo)位置的輪廓大小是預(yù)先確定的。
輪廓的面積大概是6000到8000之間,周長在300到500之間, 最后用外接矩形獲取該輪廓圖的坐標(biāo)位置和寬高大小。
如上就找到了目標(biāo)位置,剩下的工作就是將滑塊移動到指定位置即可
到此這篇關(guān)于用Python爬蟲破解滑動驗證碼的案例解析的文章就介紹到這了,更多相關(guān)Python爬蟲破解滑動驗證碼內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- python網(wǎng)絡(luò)爬蟲實現(xiàn)發(fā)送短信驗證碼的方法
- Python爬蟲爬取ts碎片視頻+驗證碼登錄功能
- python爬蟲如何解決圖片驗證碼
- Python爬蟲模擬登陸嗶哩嗶哩(bilibili)并突破點選驗證碼功能
- Python3爬蟲里關(guān)于識別微博宮格驗證碼的知識點詳解
- Python3爬蟲關(guān)于識別點觸點選驗證碼的實例講解
- Python3爬蟲關(guān)于識別檢驗滑動驗證碼的實例
- Python3爬蟲中識別圖形驗證碼的實例講解
- Python3網(wǎng)絡(luò)爬蟲開發(fā)實戰(zhàn)之極驗滑動驗證碼的識別
- python爬蟲解決驗證碼的思路及示例
- Python爬蟲實現(xiàn)驗證碼登錄代碼實例
- python爬蟲之驗證碼篇3-滑動驗證碼識別技術(shù)
- python爬蟲之自動登錄與驗證碼識別
- Python爬蟲爬驗證碼實現(xiàn)功能詳解
- Python爬蟲模擬登錄帶驗證碼網(wǎng)站
- 爬蟲Python驗證碼識別入門