《八爪魚(yú)采集器》是一款專業(yè)的高效大數(shù)據(jù)采集軟件,可以幫助用戶快速采集各類網(wǎng)站中的數(shù)據(jù)并導(dǎo)出保存,支持圖文識(shí)別、定時(shí)采集等功能,完全傻瓜式操作。且軟件滿足多種業(yè)務(wù)場(chǎng)景,各行各業(yè)都可適用,降低獲取信息的成本,從而提高效率,給用戶最簡(jiǎn)單高效的數(shù)據(jù)采集體驗(yàn)!KK下載站為大家分享八爪魚(yú)采集器免費(fèi)下載!

軟件功能
全方位監(jiān)測(cè)公開(kāi)信息,搶先獲取輿論趨勢(shì)
獲取用戶真實(shí)行為數(shù)據(jù),全面把握顧客真實(shí)需求
強(qiáng)力支撐用戶調(diào)研,準(zhǔn)確獲取用戶反饋和偏好
高效信息采集和數(shù)據(jù)清洗,及時(shí)應(yīng)對(duì)系統(tǒng)風(fēng)險(xiǎn)
軟件特色
操作簡(jiǎn)單,完全可視化圖形操作,內(nèi)置從入門(mén)到精通所需要的視頻教程,2分鐘就能上手使用
收集任務(wù)自動(dòng)分配到云中的多個(gè)服務(wù)器同時(shí)執(zhí)行,提高收集效率,在短時(shí)間內(nèi)獲得數(shù)千條信息
模板采集模式內(nèi)置數(shù)百個(gè)主流網(wǎng)站數(shù)據(jù)源,如JD.COM、天貓、公眾評(píng)論等熱門(mén)采集網(wǎng)站。只需參考模板簡(jiǎn)單設(shè)置參數(shù),即可快速獲取網(wǎng)站公開(kāi)數(shù)據(jù)
針對(duì)不同的網(wǎng)站,提供多種網(wǎng)頁(yè)采集策略和配套資源,可以定制配置,組合使用,自動(dòng)處理。這有助于整個(gè)采集過(guò)程實(shí)現(xiàn)數(shù)據(jù)的完整性和穩(wěn)定性
利用八爪魚(yú)API,可方便地獲取八爪魚(yú)任務(wù)信息和收集到的數(shù)據(jù),靈活地調(diào)度任務(wù),如遠(yuǎn)程控制任務(wù)的啟動(dòng)和停止,有效地收集和歸檔數(shù)據(jù)。基于強(qiáng)大的API系統(tǒng),還可以無(wú)縫連接公司內(nèi)部的各種管理平臺(tái),實(shí)現(xiàn)各種業(yè)務(wù)的自動(dòng)化
針對(duì)不同用戶的收藏需求,爪魚(yú)可以提供自動(dòng)生成爬蟲(chóng)的定制模式,可以準(zhǔn)確批量識(shí)別各種網(wǎng)頁(yè)元素,具有翻頁(yè)、下拉、ajax、頁(yè)面滾動(dòng)、條件判斷等多種功能,支持不同網(wǎng)頁(yè)結(jié)構(gòu)的復(fù)雜網(wǎng)站收藏,滿足多種收藏應(yīng)用場(chǎng)景
定時(shí)控制,無(wú)論是一次收集的定時(shí)設(shè)置,還是一天或一周的定時(shí)收集,都可以同時(shí)自由設(shè)置多個(gè)任務(wù),并根據(jù)需要靈活分配自己的收集任務(wù)
內(nèi)建強(qiáng)大的數(shù)據(jù)格式化引擎,支持字符串替換、正則表達(dá)式替換或匹配、去空格、添加前綴或后綴、日期時(shí)間格式化、HTML轉(zhuǎn)碼等多種功能,采集時(shí)自動(dòng)處理,無(wú)需人工干預(yù),即可獲得所需格式數(shù)據(jù)
許多主流新聞、電子商務(wù)網(wǎng)站包括一級(jí)商品列表頁(yè)面、二級(jí)商品詳情頁(yè)面和三級(jí)評(píng)論詳情頁(yè)面。無(wú)論網(wǎng)站有多少層次,八爪魚(yú)都可以不受層次限制地收集數(shù)據(jù),以滿足各種業(yè)務(wù)收集需求
內(nèi)建采集登錄模塊,只需配置目標(biāo)網(wǎng)站的帳號(hào)密碼,即可使用該模塊采集登錄后的數(shù)據(jù),首次登錄后,可自動(dòng)記憶cookie,避免了多次輸入密碼的麻煩
完全免費(fèi),并且免費(fèi)版本沒(méi)有任何功能限制
使用方法
1、啟動(dòng)八爪魚(yú)網(wǎng)頁(yè)數(shù)據(jù)采集器,需要先登錄才能使用各項(xiàng)功能。大家直接點(diǎn)擊【免費(fèi)注冊(cè)】按鈕注冊(cè)一個(gè)帳號(hào)。
2、進(jìn)入八爪魚(yú)軟件頁(yè)面后,點(diǎn)擊【快速開(kāi)始】=>【新建任務(wù)】,打開(kāi)新建任務(wù)界面
3、選擇任務(wù)組(或者新建一個(gè)任務(wù)組),輸入任務(wù)名字和描述=>點(diǎn)擊下一步
4、進(jìn)到流程配置頁(yè)面=>往流程設(shè)計(jì)器中拖入一個(gè)打開(kāi)網(wǎng)頁(yè)的步驟
5、選中打開(kāi)網(wǎng)頁(yè)步驟=>輸入頁(yè)面URL=>點(diǎn)擊保存
接下來(lái),我們就要配置采集規(guī)則了,首先點(diǎn)擊軟件下方網(wǎng)頁(yè)上要采集的數(shù)據(jù)
6、之后會(huì)出現(xiàn)一個(gè)選擇對(duì)話框,這里我們選擇‘提取這個(gè)元素的文本’
7、這樣系統(tǒng)會(huì)自己添加一個(gè)‘提取數(shù)據(jù)’步驟,這樣,一個(gè)數(shù)據(jù)點(diǎn)的采集規(guī)則就設(shè)置完成,繼續(xù)點(diǎn)擊網(wǎng)頁(yè)上的其他要采集的數(shù)據(jù)點(diǎn),并且選擇‘提取這個(gè)元素的文本’,配置其他數(shù)據(jù)點(diǎn)的采集設(shè)置。所有數(shù)據(jù)點(diǎn)都配置完成后,修改一下每個(gè)數(shù)據(jù)點(diǎn)的名稱,這樣采集流程就配置完成了。
保存之后,點(diǎn)擊下一步=>下一步=>選擇檢查任務(wù)
8、打開(kāi)本地采集頁(yè)面,點(diǎn)擊啟動(dòng)按鈕,啟動(dòng)本地采集,檢查任務(wù)運(yùn)行的效果,流程運(yùn)行后采集到的數(shù)據(jù)將會(huì)在界面下方的表格中顯示,從表格中的數(shù)據(jù)可以看到,我們想要的數(shù)據(jù)已經(jīng)成功的采集下來(lái)。
這就是最簡(jiǎn)單的采集單個(gè)網(wǎng)頁(yè)的整個(gè)流程。
安裝過(guò)程中常見(jiàn)問(wèn)題
按照以上常規(guī)操作,無(wú)法安裝八爪魚(yú)Windows客戶端?您可能遇到以下問(wèn)題:
1、安裝過(guò)程中提示【安裝已終止,安裝程序并未成功地運(yùn)行完成】
出現(xiàn)原因:之前安裝過(guò)老版本,沒(méi)有卸載干凈,有殘留。
解決方法 :刪除八爪魚(yú)緩存文件夾。找到\AppData\Roaming\Octopus8 文件夾,將Octopus8 文件夾刪除。
解決方法:打開(kāi)【控制面板】-【程序】,將之前安裝過(guò)的版本卸載干凈。
