八爪魚采集器v8.1.4 官方版

2022-08-24發(fā)布者:涂涂小可愛大?。?/span> 下載:0

文件大小:

軟件介紹

八爪魚采集器官方版介紹

八爪魚采集器可以采集獲取任何一個(gè)網(wǎng)頁信息的必備的采集工具,它徹底改變了我對(duì)爬蟲和采集器的認(rèn)識(shí),讓網(wǎng)頁數(shù)據(jù)采集變得前所未有的簡(jiǎn)單,如果你正在尋找一款好用的采集軟件,八爪魚絕對(duì)是最好的選擇。


不僅使用簡(jiǎn)單,而且功能強(qiáng)大:點(diǎn)擊,登陸,翻頁,甚至識(shí)別驗(yàn)證碼,當(dāng)網(wǎng)頁出錯(cuò)誤,或者多套模版完全不一樣的時(shí)候,還可以根據(jù)不同情況做不同的處理。

配置好采集任務(wù),就可以關(guān)機(jī)了,任務(wù)可以在云端執(zhí)行,數(shù)量龐大的企業(yè)云,24*7不間斷運(yùn)行,再也不用擔(dān)心IP被封,網(wǎng)絡(luò)中斷了,還能瞬間采集大量數(shù)據(jù)。

和市面上其他采集軟件不同的是,八爪魚采集器沒有繁雜的采集規(guī)則設(shè)置,通過鼠標(biāo)點(diǎn)擊幾次就可以成功配置一個(gè)采集任務(wù),把體驗(yàn)做到了極簡(jiǎn),大幅度提高了工作效率。用一句話形容八爪魚采集器,那就是:追本朔源,將一切行為回歸到人的本性。”

軟件特色

簡(jiǎn)易采集

簡(jiǎn)易采集模式內(nèi)置上百種主流網(wǎng)站數(shù)據(jù)源,如京東、天貓、大眾點(diǎn)評(píng)等熱門采集網(wǎng)站,只需參照模板簡(jiǎn)單設(shè)置參數(shù),就可以快速獲取網(wǎng)站公開數(shù)據(jù)。

智能防封

八爪魚采集可根據(jù)不同網(wǎng)站,自定義配置組合瀏覽器標(biāo)識(shí)(UA),全自動(dòng)代理IP,瀏覽器Cookie,驗(yàn)證碼破解等功能,實(shí)現(xiàn)突破絕大多數(shù)網(wǎng)站的防采集策略。

無限層級(jí)采集

很多主流新聞、電商類的網(wǎng)站,里面包含一級(jí)商品列表頁,也包含二級(jí)商品詳情頁,還有三級(jí)評(píng)論詳情頁面;不論網(wǎng)站有多少層級(jí),八爪魚都可以不限制層級(jí)的采集數(shù)據(jù),滿足各類業(yè)務(wù)采集需求。

支持網(wǎng)站登錄后采集

八爪魚內(nèi)置了采集登錄模塊,只需配置目標(biāo)網(wǎng)站的賬號(hào)密碼,即可用該模塊采集到登錄后的數(shù)據(jù);同時(shí)八爪魚還具備采集Cookie自定義功能,首次登錄以后,可以自動(dòng)記住cookie,免去多次輸入密碼的繁瑣,支持更多網(wǎng)站的采集。

云采集

由5000多臺(tái)云服務(wù)器支撐的云采集,7*24小時(shí)不間斷運(yùn)行,可實(shí)現(xiàn)定時(shí)采集,無需人員值守,靈活契合業(yè)務(wù)場(chǎng)景,幫你提升采集效率,保障數(shù)據(jù)時(shí)效性。

API接口

通過八爪魚API,可以輕松獲取八爪魚任務(wù)信息和采集到的數(shù)據(jù),靈活調(diào)度任務(wù),比如遠(yuǎn)程控制任務(wù)啟動(dòng)與停止,高效實(shí)現(xiàn)數(shù)據(jù)采集與歸檔?;趶?qiáng)大的API體系,還可以無縫對(duì)接公司內(nèi)部各類管理平臺(tái),實(shí)現(xiàn)各類業(yè)務(wù)自動(dòng)化。

自定義采集

針對(duì)不同用戶的采集需求,八爪魚可提供自動(dòng)生成爬蟲的自定義模式,可精準(zhǔn)批量識(shí)別各種網(wǎng)頁元素,還有翻頁、下拉、ajax、頁面滾動(dòng)、條件判斷等多種功能,支持不同網(wǎng)頁結(jié)構(gòu)的復(fù)雜網(wǎng)站采集,滿足多種采集應(yīng)用場(chǎng)景。

便捷定時(shí)功能

簡(jiǎn)單幾步點(diǎn)擊設(shè)置,即可實(shí)現(xiàn)采集任務(wù)的定時(shí)控制,不論是單次采集的定時(shí)設(shè)置,還是預(yù)設(shè)某一天或是每周每月的定時(shí)采集,都可以同時(shí)對(duì)多個(gè)任務(wù)自由進(jìn)行設(shè)置,根據(jù)需要對(duì)選擇時(shí)間進(jìn)行多重組合,靈活調(diào)配自己的采集任務(wù)。

全自動(dòng)數(shù)據(jù)格式化

八爪魚內(nèi)置了強(qiáng)大的數(shù)據(jù)格式化引擎,支持字符串替換、正則表達(dá)式替換或匹配、去除空格、添加前綴或后綴、日期時(shí)間格式化、HTML轉(zhuǎn)碼等多項(xiàng)功能,采集過程中全自動(dòng)處理,無需人工干預(yù),即可得到所需格式數(shù)據(jù)。

更新日志:

主要體驗(yàn)改進(jìn)

優(yōu)化網(wǎng)頁列表數(shù)據(jù)自動(dòng)識(shí)別,將識(shí)別率提高到90%以上

Bug修復(fù)

解決自定義配置中循環(huán)輸入文本中循環(huán)項(xiàng)重復(fù)的問題

解決自定義配置當(dāng)前頁面數(shù)據(jù)預(yù)覽中有時(shí)會(huì)多出一列空數(shù)據(jù)的問題

解決自定義配置中有時(shí)候自動(dòng)識(shí)別生成的采集流程不正確的問題

解決自定義配置當(dāng)前頁面數(shù)據(jù)預(yù)覽中拖動(dòng)改變字段順序后修改字段名錯(cuò)誤的問題

解決本地采集中部分網(wǎng)頁Cookie不生效問題

解決自定義配置中自動(dòng)識(shí)別生成的采集字段中有空格的問題

解決本地采集中部分網(wǎng)站無法滾動(dòng)加載數(shù)據(jù)的問題

解決本地采集中某些情況下數(shù)據(jù)格式化不正確的問題

解決自定義配置提取數(shù)據(jù)配置中修改字段后沒有應(yīng)用也生效的問題

解決自定義配置中部分網(wǎng)頁自動(dòng)識(shí)別有時(shí)會(huì)卡住的問題

解決自定義配置自動(dòng)識(shí)別的數(shù)據(jù)預(yù)覽中有時(shí)修改字段名會(huì)白屏的問題

解決主界面左側(cè)賬戶過期時(shí)間顯示的問題

解決自定義配置中某些操作會(huì)造成流程圖錯(cuò)亂的問題

八爪魚采集器怎么用

1、打開八爪魚采集器的客戶端,登陸軟件之后新建一個(gè)任務(wù),打開你要采集的網(wǎng)站地址。這里我自己示范的原創(chuàng)設(shè)計(jì)手稿的采集。


2、進(jìn)入到設(shè)計(jì)工作流程環(huán)節(jié),在界面瀏覽器那輸入你要采集的網(wǎng)址,點(diǎn)擊打開,你就能看到你要采集的網(wǎng)站界面,由于這個(gè)網(wǎng)址存在多頁內(nèi)容需要采集,我們?cè)僭O(shè)置采集規(guī)則的時(shí)候,可以先建立翻頁循環(huán),先把鼠標(biāo)選擇頁面上的【下一頁】按鈕,在彈出的任務(wù)對(duì)話框,選擇高級(jí)選項(xiàng)中的【循環(huán)點(diǎn)擊下一頁】,軟件會(huì)自動(dòng)建立一個(gè)翻頁循環(huán)。


3、建好翻頁循環(huán)好,就是采集當(dāng)前頁上的內(nèi)容,我要采集圖片的URL,就選中一個(gè)圖片,然后單擊,軟件會(huì)自動(dòng)彈出對(duì)話框,先建立一個(gè)元素循環(huán)列表。當(dāng)前頁面的所有元素都被抓取后,循環(huán)列表則建立完成。

4、設(shè)置要抓取的內(nèi)容,選擇元素循環(huán)列表中的任意一個(gè)元素,在瀏覽器內(nèi)找到該元素對(duì)應(yīng)的圖片,點(diǎn)擊后彈出對(duì)話框,選擇【抓取這個(gè)元素的圖片地址】為字段1,同時(shí)我為了方便識(shí)別,還抓取了字段2為圖片標(biāo)題名稱,設(shè)置原理同圖片地址。


5、檢查一下,翻頁循環(huán)框應(yīng)該將產(chǎn)品循環(huán)框嵌套在內(nèi),表示,先抓取完當(dāng)前一整頁的圖片URL后再翻頁。

6、設(shè)置執(zhí)行計(jì)劃后,就可以開始采集了,單擊采集的話,直接點(diǎn)擊【完成】步驟下的【檢查任務(wù)】,開始運(yùn)行任務(wù)。采集完畢后可以直接下載成Excel的文件。

7、將URL轉(zhuǎn)換為圖片,這里用八爪魚圖片轉(zhuǎn)換工具,將EXCEL導(dǎo)入之后,就可以自動(dòng)等待系統(tǒng)將圖片下載下來了!


發(fā)表評(píng)論(共0條評(píng)論)
請(qǐng)自覺遵守互聯(lián)網(wǎng)相關(guān)政策法規(guī),評(píng)論內(nèi)容只代表網(wǎng)友觀點(diǎn),發(fā)表審核后顯示!

版權(quán)聲明:

1 本站所有資源(含游戲)均是軟件作者、開發(fā)商投稿,任何涉及商業(yè)盈利目的均不得使用,否則產(chǎn)生的一切后果將由您自己承擔(dān)!

2 本站將不對(duì)任何資源負(fù)法律責(zé)任,所有資源請(qǐng)?jiān)谙螺d后24小時(shí)內(nèi)刪除。

3 若有關(guān)在線投稿、無法下載等問題,請(qǐng)與本站客服人員聯(lián)系。

4 如侵犯了您的版權(quán)、商標(biāo)等,請(qǐng)立刻聯(lián)系我們并具體說明情況后,本站將盡快處理刪除,聯(lián)系QQ:2499894784

返回頂部