文件大小:
軟件介紹
InfoSpider爬蟲工具箱由國內一位開發(fā)者在 GitHub 上制作,目的在于幫助用戶安全快捷的拿回自己的數據,并提供數據分析功能,可以幫助用戶從各大軟件和網站當中拿出你自己的數據內容,基于用戶數據生成圖表文件,讓用戶能更直觀、深入了解自己的信息。
軟件功能
INFO-SPIDER 是一個集眾多數據源于一身的爬蟲工具箱,旨在安全快捷的幫助用戶拿回自己的數據,工具代碼開源,流程透明。支持數據源包括 GitHub 、QQ 郵箱、網易郵箱、阿里郵箱、新浪郵箱、Hotmail 郵箱、Outlook 郵箱、京東、淘寶、支付寶、中國移動、中國聯通、中國電信、知乎、嗶哩嗶哩、網易云音樂、QQ 好友、QQ 群、生成朋友圈相冊、瀏覽器瀏覽歷史、12306 、博客園、CSDN 博客、開源中國博客、簡書。
軟件特色
安全可靠:本項目為開源項目,代碼簡潔,所有源碼可見,本地運行,安全可靠。
使用簡單:提供 GUI 界面,只需點擊所需獲取的數據源并根據提示操作即可。
結構清晰:本項目的所有數據源相互獨立,可移植性高,所有爬蟲腳本在項目的 Spiders 文件下。
數據源豐富:本項目目前支持多達24+個數據源,持續(xù)更新。
數據格式統(tǒng)一:爬取的所有數據都將存儲為json格式,方便后期數據分析。
個人數據豐富:本項目將盡可能多地為你爬取個人數據,后期數據處理可根據需要刪減。
數據分析:本項目提供個人數據的可視化分析,目前僅部分支持。
文檔豐富:本項目包含完整全面的使用說明文檔和視頻教程
安裝說明
安裝python3和Chrome瀏覽器
安裝與Chrome瀏覽器相同版本的驅動
安裝依賴庫 pip install -r requirements.txt
工具運行
進入 tools 目錄
運行 python3 main.py
在打開的窗口點擊數據源按鈕, 根據提示選擇數據保存路徑
彈出的瀏覽器輸入用戶密碼后會自動開始爬取數據, 爬取完成瀏覽器會自動關閉.
在對應的目錄下可以查看下載下來的數據(xxx.json), 數據分析圖表(xxx.html)
軟件截圖
版權聲明:
1 本站所有資源(含游戲)均是軟件作者、開發(fā)商投稿,任何涉及商業(yè)盈利目的均不得使用,否則產生的一切后果將由您自己承擔!
2 本站將不對任何資源負法律責任,所有資源請在下載后24小時內刪除。
3 若有關在線投稿、無法下載等問題,請與本站客服人員聯系。
4 如侵犯了您的版權、商標等,請立刻聯系我們并具體說明情況后,本站將盡快處理刪除,聯系QQ:2499894784
點擊加載更多評論>>