返回頂部
關(guān)閉軟件導航
位置:首頁 > 資訊 > 帝國新聞>帝國、PHPCMS及織夢對比(十一):采集功能

  提到采集,有些站長拋出鄙夷的眼神,而似乎大部分站長都會覺得是CMS的標配。在落葉看來采集只是一個功能,一個工具,關(guān)鍵看是采什么,采來后做什么,怎么處理采來的內(nèi)容。大家都知道火車頭,一般基本用來采文章,但落葉經(jīng)常用來采集郵箱,CMS間導數(shù)據(jù),基至都用來采過QQ號。火車頭的整套流程即使對采集規(guī)則了解不多,也很方便來采文章,那么相較之于這種客戶端軟件,主流CMS中的采集模塊,有哪些優(yōu)缺點呢?

  本文中落葉對PHPCMS、帝國CMS及DEDECMS的采集功能作些對比,同時也對采集流程細節(jié)作些需求分析。

  我們知道,通常的采集流程都是通過列表頁分頁批量獲取內(nèi)容頁網(wǎng)址,然后對內(nèi)容頁分析,獲取內(nèi)容標題、文章內(nèi)容等信息,因為各目標站的結(jié)構(gòu)不同帝國cms批量上傳助手,采集規(guī)則會不同,CMS不可能也不會提供通用的采集規(guī)則,那么要考量一款CMS采集帝國cms軟件采集模塊是否好用基本是由整個采集任務(wù)設(shè)置流程的易用性、采集的穩(wěn)定性與效率、采集完入庫方便性等方面決定。

  1.采集設(shè)置流程:

  整體體驗:

  PHPCMS的任務(wù)添加流程中直接在TAB菜單的形式列出來網(wǎng)址采集、內(nèi)容規(guī)則設(shè)置、高級設(shè)置三步驟,每一步中的結(jié)構(gòu)都和火車頭比較像,對火車頭采集的比較熟悉用戶會覺得PHPCMS的采集設(shè)置比較明了。DEDE中流程類似,只是沒有直接將幾步列出,后一步的設(shè)置的前提是前一步設(shè)置正確。帝國CMS 中則是希望用戶一口吃飽,從上至下把需要的信息全部列出來。

  其實整體都基本三步,沒有太明顯的區(qū)別是,只是三者表現(xiàn)方式的不同給用戶的心理感受是不同的。PHPCMS簡潔明了,讓用戶覺得采集很簡單,三下兩下就設(shè)置好了,新手愿意去嘗試。帝國CMS中用戶一進入采集設(shè)置界面頓感壓力,頁面一直下拖,這么多設(shè)置項,首先想到的是“算了,換別的采集”,“這么多填到什么時候,填完了能不能提交還是一回事”,而DEDECMS中把采集過程和設(shè)置流程整合起來,優(yōu)點時可以保證每一步都設(shè)置正確,但對采集比較熟悉的用戶而言,效率偏低,每次都得POST提交一次測試一次。

  網(wǎng)址采集:

  PHPCMS網(wǎng)址采集通過列表頁分頁通配符實現(xiàn)列表頁網(wǎng)址批量添加,然后設(shè)置所需采集的網(wǎng)址區(qū)域,很多時候帝國cms批量添加產(chǎn)品,對不熟悉HTML采集規(guī)則查找技巧的朋友可以通過直接設(shè)置“網(wǎng)址中必須包含”和“網(wǎng)址中不得包含”這兩項來實現(xiàn)內(nèi)容頁網(wǎng)址的采集。DEDECMS也用*作分頁通配符帝國cms批量上傳助手,不過DEDE中的優(yōu)點在于可以啟用多欄目通配規(guī)則,針對不同的欄目頁批量設(shè)置采集規(guī)則,這樣可以方便對有相同URL規(guī)則的多個欄目同時采集。帝國中則也只是一般的以為通配符的多分頁獲取,相對表現(xiàn)平平。

  \

  PHPCMS中提供通過填寫COOKIES信息對需要登陸的網(wǎng)站的采集,不過只對深度用戶有用,一般用不著,DEDECMS中則提供了防盜鏈模式的設(shè)置,通過填入目標站內(nèi)容頁地址,采集時偽造來源來達到破解簡單防盜鏈采集的目的,這點還是挺不錯的。帝國CMS對相對路徑的處理提供了填寫“內(nèi)容頁地址前輟”的字段,但其實本應(yīng)該做到URL自動擴充補全的。

  內(nèi)容規(guī)則的設(shè)置:

  內(nèi)容頁規(guī)則的設(shè)置一般是針對每個字段提供設(shè)置匹配規(guī)則,同時進行一些格式過濾和信息替換。對比三款CMS,PHPCMS中的字段設(shè)置更人性化些,很清晰的實現(xiàn)了匹配信息的提取、信息替換、格式過濾的功能,而DEDECMS和帝國CMS中都直接一個textarea給出,讓用戶填寫正則內(nèi)容,體驗上稍差些。DEDECMS中也以彈出窗口的方式給出了常用格式的過濾的勾選框,直接勾選可以生成過濾規(guī)則,表現(xiàn)方式不夠明顯帝國cms批量更新文章,不適合新手使用,帝國則似乎完全是針對正則高手的,而實際用帝國的新手用戶居多,我很為帝國擔心,“有人用他的采集功能么?”

  \

  2. 采集穩(wěn)定性與效率:

  采集效率受限于服務(wù)器本身及網(wǎng)絡(luò)環(huán)境,各CMS在技術(shù)上的差異不大,而穩(wěn)定性則處決于采集流程及出錯處理。這塊PHPCMS的優(yōu)勢很明顯,支持多線程采集,并以進展條方式展示,在采集中斷時可刷新界面斷點續(xù)采,效率和穩(wěn)定性個人覺得挺不錯。對已采集過的網(wǎng)址記錄方式也仿照火車頭的方式進行記錄,防止重復采集。

  \

  DEDE則仍體現(xiàn)在他的細致上,每一步做過很多細節(jié)提示,優(yōu)點的可以清楚知道怎樣操作,缺點是太多需要讓我思考的地方,帝國CMS似乎對得重復采集未作判斷,即使刷新或后退都存在得復采集的情況。

  3. 采集完入庫:

  帝國CMS在采集設(shè)置流程中即設(shè)置好了所采集的信息所對應(yīng)入庫的欄目,采集過程字段設(shè)置也完全與欄目的字段匹配,PHPCMS在采集前設(shè)置好了對應(yīng)的欄目,但各字段并沒有綁定,在采集完進行發(fā)布時,可以重新選擇字段的對應(yīng)關(guān)系,并可對一些字段如關(guān)鍵詞、摘要、縮略圖、時間等在發(fā)布時自動使用函數(shù)處理后填充帝國cms采集軟件。DEDECMS中在采集時未綁定欄目,發(fā)布時選擇欄目導入,比較方便,但不支持字段選擇??傮w,落葉個人還是偏向于PHPCMS的地導入方式。

如果您覺得 帝國、PHPCMS及織夢對比(十一):采集功能 這篇文章對您有用,請分享給您的好友,謝謝
文章地址:http://www.meyanliao.com/article/diguo/dgPHPCMSjzmdbsycjgn.html
解放雙手無盡可能,有問題添加天線貓微信
主站蜘蛛池模板: 国产精品亚韩精品无码a在线 | 人妻丰满AV无码久久不卡| 日韩精品无码一区二区三区 | 韩国精品一区二区三区无码视频| 亚洲精品无码专区在线在线播放| 免费无码黄网站在线观看| 亚洲国产成人精品无码区在线秒播| 国产精品无码国模私拍视频 | 无码国产乱人伦偷精品视频| 亚洲AV无码片一区二区三区 | 亚洲AV无码专区在线电影成人 | 曰韩无码无遮挡A级毛片| 精品无码久久久久国产| 粉嫩大学生无套内射无码卡视频| 人妻少妇无码视频在线| 日韩毛片免费无码无毒视频观看| 亚洲AV无码一区二区三区人| 久久无码人妻一区二区三区午夜| 欧洲成人午夜精品无码区久久 | 亚洲精品无码成人片久久不卡| 亚洲AV无码一区二区三区牛牛| 无码人妻精品一区二区三区蜜桃 | 日韩A无码AV一区二区三区| 欧洲精品无码成人久久久| 人妻无码一区二区视频| 亚洲成A∨人片天堂网无码| 最新国产精品无码| 日韩毛片免费无码无毒视频观看| 成人免费无遮挡无码黄漫视频| 国产高清无码二区 | 国模无码人体一区二区 | 国产精品一级毛片无码视频 | 无码国产亚洲日韩国精品视频一区二区三区| 无码视频一区二区三区在线观看| 日韩网红少妇无码视频香港| 无码熟妇人妻在线视频| 国产AV巨作情欲放纵无码| 亚洲国产成人精品无码一区二区| 无码国产亚洲日韩国精品视频一区二区三区| 国产色无码专区在线观看| 无码激情做a爰片毛片AV片 |