• <li id="00i08"><input id="00i08"></input></li>
  • <sup id="00i08"><tbody id="00i08"></tbody></sup>
    <abbr id="00i08"></abbr>
  • 關(guān) 閉

    新聞中心

    EEPW首頁 > 工控自動化 > 設(shè)計應(yīng)用 > 基于網(wǎng)絡(luò)設(shè)備的網(wǎng)頁過濾的設(shè)計

    基于網(wǎng)絡(luò)設(shè)備的網(wǎng)頁過濾的設(shè)計

    作者: 時間:2011-03-25 來源:網(wǎng)絡(luò) 收藏

    在網(wǎng)頁過濾技術(shù)中,URL 過濾是普遍采用的過濾方式,因為其設(shè)計實現(xiàn)非常簡單,速度快、效率高;但是互聯(lián)網(wǎng)是動態(tài)的,每天有數(shù)以萬計的新的網(wǎng)頁出現(xiàn),URL 名單的更新速度往往跟不上;如果單純的采用URL 過濾,會造成過濾的遺漏

    本文引用地址:http://www.czjhyjcfj.com/article/202467.htm

      內(nèi)容過濾能夠?qū)崿F(xiàn)實時的網(wǎng)頁內(nèi)容防護,過濾比較準確,但是因為內(nèi)容過濾過程比較復雜,處理量如果過大,會造成用戶上網(wǎng)的明顯延遲。

      設(shè)計的方法是基于網(wǎng)絡(luò)層的網(wǎng)頁過濾方法,在上實現(xiàn)對網(wǎng)頁的過濾。采用URL 過濾與內(nèi)容過濾相結(jié)合的方式,取安全與性能的折中。

      1 網(wǎng)頁過濾總體框架

      一臺主機要訪問Web 服務(wù)器,首先與Web 服務(wù)器進行三次握手,建立TCP 連接;然后向Web 服務(wù)器發(fā)送請求報文,其中包含用戶訪問的URL,Web 服務(wù)器在收到請求報文后,會發(fā)送應(yīng)答報文給客戶主機,因此過濾流程框架可按如下設(shè)計:

     ?、僭?a class="contentlabel" href="http://www.czjhyjcfj.com/news/listbylabel/label/網(wǎng)絡(luò)設(shè)備">網(wǎng)絡(luò)設(shè)備中*用戶的數(shù)據(jù)包,檢測到HTTP 請求報文[3],則分析該報文中嵌入的網(wǎng)頁地址信息(即URL),提取出URL 信息,對其進行在黑白名單中進行匹配分析,根據(jù)匹配結(jié)果給予是否通過;②內(nèi)容過濾采用“第一次放過”的策略,即第一次對未知URL 的返回報文僅做內(nèi)容檢查。收集服務(wù)器返回的HTTP響應(yīng)報文,提取出應(yīng)用層信息,組成完整的HTML 文檔,進行內(nèi)容過濾,根據(jù)判定結(jié)果進行相應(yīng)的操作,整體過濾步驟如圖1 所示。

     過濾模型

    圖1 過濾模型

      2 URL 過濾

      2.1 相關(guān)定義

      白(黑)名單:在該名單中的URL,必定是合(非)法的地址信息;未在該名單中的網(wǎng)址的合法性未知。

      2.2 黑白名單機制的設(shè)計

      URL 過濾框架的設(shè)計是基于兩個事實:

     ?、僖蛱鼐W(wǎng)統(tǒng)計表明,超過80%的用戶經(jīng)常訪問的是20%的網(wǎng)頁內(nèi)容;②大多數(shù)用戶在多數(shù)時間內(nèi)訪問的是合法信息的網(wǎng)頁。

      基于上述事實一,設(shè)計白名單時,僅存放經(jīng)常訪問的合法網(wǎng)站地址信息。這樣設(shè)計可以保證在進行URL 匹配時,能夠快速高效地判斷該網(wǎng)頁地址是否在高頻白名單中。對于一段時間內(nèi)訪問頻率不高的網(wǎng)頁,采用老化機制將其從名單中移除。

      基于上述事實二,設(shè)計將URL 白名單放在黑名單之前,若采用黑名單在前的方式,將會浪費大量時間去查找黑名單,而在大多數(shù)時間內(nèi),這些查找是不必要的。

      2.3 URL 過濾

      URL 過濾過程有:

     ?、贆z測通過的報文,發(fā)現(xiàn)是HTTP 的GET 方法請求報文,提取其中攜帶的URL 信息,若與高頻名單中的條目匹配,表示該URL 為合法,給予通過,并將該條目的統(tǒng)計計數(shù)加1;②若在白名單中沒有匹配,則繼續(xù)和黑名單中的條目進行匹配。如果匹配成功,則斷開該TCP 鏈接,并且該匹配條目的統(tǒng)計計數(shù)加1;③若匹配失敗,則進行內(nèi)容,根據(jù)內(nèi)容過濾的結(jié)果將URL添加到相應(yīng)名單中。

      2.4 黑白名單老化機制

      黑白名單老化機制步驟如下:

     ?、儆嬎忝麊沃蠻RL 條目訪問次數(shù)的平均值M,計算公式如公式1:


      其中n 為表中的URL 條目數(shù),mi為第i 個條目的統(tǒng)計計數(shù)值;②將老化閾值設(shè)為該平均值;③遍歷所有的URL 條目,檢查每個URL 條目的統(tǒng)計計數(shù),若高于老化閾值,則將其保留在名單中,并且將統(tǒng)計計數(shù)值0,如果低于老化閾值,則將其剔除。


    上一頁 1 2 3 下一頁

    關(guān)鍵詞: 網(wǎng)絡(luò)設(shè)備

    評論


    相關(guān)推薦

    技術(shù)專區(qū)

    關(guān)閉
    主站蜘蛛池模板: 惠水县| 深泽县| 吉林市| 崇州市| 视频| 迁安市| 湖北省| 上犹县| 常熟市| 镇巴县| 石景山区| 田林县| 宜章县| 平果县| 梁平县| 香格里拉县| 海丰县| 旌德县| 民勤县| 西贡区| 平顶山市| 黎川县| 汉阴县| 辽宁省| 普宁市| 赫章县| 色达县| 定远县| 北票市| 尖扎县| 大厂| 额尔古纳市| 民丰县| 伊宁市| 兰西县| 拉萨市| 苗栗市| 班戈县| 平顶山市| 大邑县| 栾城县|