紅葉文章采集器 v3.6中文綠色版

2024-06-04發(fā)布者:wx20230305205025大小: 下載:0

文件大小:

軟件介紹

超級強大的網(wǎng)站文章采集器,本軟件全名為紅葉文章采集器,英文名稱Fast_Spider,屬于蜘蛛爬蟲類程序,用于從指定網(wǎng)站采集海量精華文章,將直接丟棄其中的垃圾網(wǎng)頁信息,僅保存具備閱讀價值和瀏覽價值的精華文章,自動執(zhí)行HTM-TXT轉(zhuǎn)換。本軟件為綠色軟件解壓即可使用!

image.png

軟件特色

(1)本軟件采用北大天網(wǎng)MD5指紋排重算法,對于相似相同的網(wǎng)頁信息,不再重復(fù)保存。

(2)采集信息含義:[[HT]]表示網(wǎng)頁標(biāo)題,[[HA]]表示文章標(biāo)題,[[HC]]表示10個權(quán)重關(guān)鍵字,[[UR]]表示網(wǎng)頁中的圖片鏈接,[[TXT]]之后為正文。

(3)蜘蛛性能:本軟件開啟300個線程來保證采集效率。通過采集100萬精華文章來執(zhí)行壓力測試,以普通網(wǎng)民的聯(lián)網(wǎng)計算機(jī)為參考標(biāo)準(zhǔn),單臺計算機(jī)可以在一天內(nèi)遍歷200萬網(wǎng)頁、采集20萬精華文章,100萬精華文章僅需5天就可采集完畢。

(4) 正式版與免費版的區(qū)別在于:正式版允許將采集的精華文章數(shù)據(jù)自動保存為ACCESS數(shù)據(jù)庫。購買正式版請聯(lián)系QQ(970093569)。

操作方法

(1)使用前,必須確保你的計算機(jī)可以連通網(wǎng)絡(luò),且防火墻不要攔截本軟件。

(2)運行SETUP.EXE和setup2.exe,以安裝操作系統(tǒng)system32支持庫。

(3)運行spider.exe,輸入網(wǎng)址入口,先點"人工添加"按鈕,再點"啟動"按鈕,將開始執(zhí)行采集。

注意事項

(1)抓取深度:填寫0表示不限制抓取深度;填寫3表示抓到第3層。

(2)通用蜘蛛模式與分類蜘蛛模式的區(qū)別:假定網(wǎng)址入口為“http://youxi.baidu.com/”,若選擇

發(fā)表評論(共0條評論)
請自覺遵守互聯(lián)網(wǎng)相關(guān)政策法規(guī),評論內(nèi)容只代表網(wǎng)友觀點,發(fā)表審核后顯示!

版權(quán)聲明:

1 本站所有資源(含游戲)均是軟件作者、開發(fā)商投稿,任何涉及商業(yè)盈利目的均不得使用,否則產(chǎn)生的一切后果將由您自己承擔(dān)!

2 本站將不對任何資源負(fù)法律責(zé)任,所有資源請在下載后24小時內(nèi)刪除。

3 若有關(guān)在線投稿、無法下載等問題,請與本站客服人員聯(lián)系。

4 如侵犯了您的版權(quán)、商標(biāo)等,請立刻聯(lián)系我們并具體說明情況后,本站將盡快處理刪除,聯(lián)系QQ:2499894784

返回頂部