自適應網站綜述

xyzlotus發表於2009-06-09

自適應網站綜述

xyzlotus@gmail.com

摘要:傳統的網站是為滿足一般使用者的需求來設計的,自適應網站,可以為單個使用者或者一組使用者定製內容和介面,從而提供一種有效的互動方式。

關鍵詞:自適應網站 個性化 定製

一、自適應網站簡介

自適應網站根據不同的使用者來定製內容和介面,通過學習使用者的訪問模式,可以半自動的提高網站的組織和展示形式。同時,自適應網站可以自動的建立一些頁面,刪除或者增加一些連結,高亮顯示或者重新組織連結,對頁面內容重新格式化等。

自適應可以分為基於內容和基於訪問兩類。基於內容的適應根據頁面的內容來展示和組織頁面。基於訪問的適應根據使用者與網站的互動,來跟蹤使用者的活動,獲取使用者導航模式,從而為其個性化頁面內容和佈局。

二、自適應網站技術

1、索引頁合成問題。

在文獻[1]中,PerkowitzEtzioni提出了自適應網站中索引頁合成問題,並使用PageGather演算法來解決。

索引頁是一個包含一組特定主題頁連結的頁面。索引頁合成問題,就是給定一個站點和使用者訪問日誌,來建立包含一組沒有連結但相互相關的頁面連結的頁面。在索引頁合成問題中需要考慮如下幾個要素:索引頁的內容、超連結如果排序、超連結的標籤、頁的標題、是否適合將該索引頁加到站點等。在該文中,僅對索引頁的內容和頁的標題這兩個問題做深入研究。

PageGather演算法的思想是,計算不同頁面同時出現的頻度並建立相似矩陣,其次根據矩陣建立對應的圖,再使用圖演算法來抽取簇。可以使用兩種圖演算法:找所有的連通分支(connected components)或者找圖裡邊的所有最大團(maximal cliques)。把得到的簇,按簇中所有成對頁面出現頻度的平均值評分並且排序,管理員可以選取前N個評分較高的簇。由於在產生簇的時候,不同的簇之間會有重疊,所以可以採取不同的辦法來消除重疊部分,如約簡和合並。然後,該演算法將產生的候選簇展示給管理員,由管理員來決定選擇哪一個簇或者移除哪些不必要的連結。最後,用目標頁的標題作為連結的標籤,按照字母順序來排序,產生一個新的頁面。管理可以將產生的索引頁加在站點的某一位置。

該演算法也存在一些有待改進的地方。首先,連結的排序問題。想提升使用者的訪問體驗,就應該讓使用者在短時間內找到自己所感興趣的東西,而一般使用者點選的次序是從頁面頂站到底端的。僅用字母順序,很有可能出現這一種情況:使用者點選的前面幾個索引頁裡邊的連結不是自己感興趣的,從而放棄瀏覽該站點。可以考慮結合使用頁面的點選率或者使用者的訪問模式,從而對連結進行評分,按照評分的高低次序來排序。還可以考慮使用收益值,來反饋該索引頁連結的有用性,從而對索引頁進行更新。第二,該演算法最終產生的索引頁需要讓管理員從產生的候選簇中來選取,一定程式上帶有主觀性,並且系統也依賴於人工。如何讓系統自動建立索引頁,並加到相應的地方,也有待於改進。在這裡,簇的選擇可以考慮結合使用者的訪問模式來自動選取,然後在放置索引頁的地方將原始頁面內容替換掉。

2、為移動使用者定製個性化站點。

在文獻[2]中,Anderson,DomingosWeld提出了為移動使用者提供個性化站點,並描述了一個框架,提出了很多針對無線使用者個性化網站的方法。並在文獻[3]中,就自適應導航中的“捷徑”問題,做了詳細的研究。在文獻[4]中,進一步對“捷徑”問題中的預測頁面模型做了補充,提出了關係馬爾剋夫模型。

在文獻[2]中,作者提出了一個數學模型,描述了個性化推薦的的若干問題,包括輸入和輸出特徵。然後,推薦器在站點狀態空間進行搜尋,直至沒有更好的狀態出現或者計算資源耗盡為止。站點狀態空間是一系列狀態的集合,最初的狀態就是原始示經過修改更新的站點。此後的狀態可能是通過一些自適應函式轉變過的,這包括建立頁面,刪除頁面,增加頁面之間的連結等。每一個當前狀態都通過一些期望效用值來衡量。

個性化推薦的輸入就是:站點W,使用者集V,當前使用者v和請求的URL u及評估函式F,輸出為使得F值最大的請求頁U的定製版本。站點的每一個狀態,可以是一組頁面和連結的直接圖。在評估個性化站點的質量時,作者使用了期望效用值。期望效用值包括內部期望效用和外部期望效用。內部期望效用用於衡量頁面的內容與使用者目標資訊的吻合程度,外部期望效用通過為使用者的導航動作(即滾動螢幕和點選連結)賦予不同的權值來遞迴計算。關於頁面的轉換操作,作者提出了三種:內容消除,左右子樹交換,增加“捷徑”。

文獻[3]中,作者提出了為無線使用者請求的每一個頁面自動地增加“捷徑”。所謂“捷徑”是連線兩個沒有連結在一起的頁面,從而可以便得使用者更快的到達目的頁面,減少瀏覽時間。在該文中,作者採用MinPath演算法來尋找捷徑。演算法的輸入是:當前使用者V,使用者trail字首,“捷徑”的最大數目m,輸出是前m個最好的“捷徑”集合。MinPath演算法的核心思想是:通過遍歷站點連結結構形成的直接圖來建立trail字尾。從使用者最後請求的頁面pi開始,用函式ExpectedSavings計算其後面每一個連結的概率,遞迴地遍歷圖,直到瀏覽某個頁面的概率低於一個閾值或者超過深度邊界。然後對產生的結果進行比較,根據期望節省值排序,返回前m個“捷徑”。

MinPath演算法中,有兩個關鍵問題:一是期望節省這個度量值的選取,二是頁面預測模型。在該文中,一個“捷徑”通過期望節省來度量它為使用者所節省的連結數目和瀏覽所花費的努力,期望節省值是捷徑的每一條路徑所節省的連結數目與該路徑概率乘積之和。

由於要遞迴的遍歷站點連結形成的圖,所以需要計算使用者請求每一個面的概率。在該文中,作者提出了四個預測模型,分別是:無條件模型、貝葉斯模型、馬爾剋夫模型和馬爾剋夫/位置模型。

關於MinPath演算法,可以考慮使用序列模式來構建使用者trail字尾。在一定程度上可以減少運算量,同時避免出現一些無用的或者不符合使用者興趣的“捷徑”。另外,期望節省這個度量值有待改進,僅使用路徑訪問的概率並不能準確充度量。

文獻[4]中,作者提出了改進的關係馬爾剋夫模型。上文的中馬爾克模型,其狀態集就是站點連結圖中的頁面集,其轉移矩陣即是對應的每一對頁面之間的轉移概率。而關係馬爾剋夫模型的狀態集是一個層層包含的關係,可以是一個主題,一組頁面等。在該模型中,採用一個五元組來分別描述域,關係,頁面集等。這個模型能夠有效處理稀疏資料,降低系統的運算量,增加推薦的準確率。

3、自適應網店

文獻[5]中,提出了一個SETA模型。SETA是一個框架(prototype),通過它可以輔助建立自適應網上商店。在該框架中,運用了使用者建模和個性化技術。

SETA以基於模板的方法建立最初的使用者模型,利用動態建模技術,對使用者的互動行為進行跟蹤,不斷更新使用者模型。然後根據使用者模型的資訊,如領域知識、興趣、接 受能力等,從長度、語法、圖形展示等方面,為使用者定製商品的描述;SETA同時為商品的接受方(beneficiary)建立模型,並利用基於內容(content-based)的技術,為他們推薦最適合的商品。SEAT根據商品與使用者偏好的匹配程度進行推薦。在個性化時,不僅考慮到為使用者定製商品描述資訊,同時也對頁面佈局(如背景顏色、字型大小等)進行個性化。

在該文中,進一步可以完善的地方有:對頁面結構的定製,個性化廣告選擇、通過使用者的隱式反饋來更新等。

三、總結與展望

綜上所述,自適應網站就是為了讓不同的使用者得到不同的訪問體驗,從而提升網站的服務質量。大休來看,有二大方向:一是為一般個人PC使用者進行個性化定製,第二個方向就是為無線使用者提供自適應網站。這兩者側重點有所不同。

為一般個人PC使用者進行個性化定製站點,主要是根據使用者的訪問模式,來個性化定製使用者所感興趣的東西,便於使用者瀏覽的同時,能迅速的找到目標資訊。所以可以使用諸如索引頁合成,刪除或者增加某些頁面,增加或者移除一些連結,替換一些頁面等,同時可以對頁面的佈局,結構,圖片,廣告等進行個性化定製。

而為無線使用者定製自適應網站,就需要考慮移動裝置的頻寬和螢幕。如何在有限的空間和有限的傳輸速度下,為使用者個性化頁面,是重中之重。在為無線使用者個性化定製時,已有的成果是採用內容消除(如消除圖片,廣告,動畫,框架等),交換頁面模組,增加“捷徑”等方法來實現的。

同時,在自適應網站實現過程中,都用到了建模和資料探勘技術。選擇合適的挖掘演算法,對結果也是有重要影響的。

可以大膽設想一下,能否實現這種自適應網站,根據使用者的頻寬或者使用者接入網路的方式,來實現對不同使用者群進行個性化定製。

參考文獻:

[1] Mike Perkowits,Oren Etzioni. Towards adaptive Web sites:Conceptual framework and case study

[2]Corin R.Anderson,Pedro Domingos,Daniel S.Weld. Personalizing Web Sites for Mobile Users

[3]Corin R.Anderson,Pedro Domingos,Daniel S.Weld. Adaptive Web Navigation for Wireless Devices

[4] Corin R.Anderson,Pedro Domingos,Daniel S.Weld. Relational Markov Models and their Application to Adaptive Web Navigation

[5]Liliana Ardissono,Anna Goy. Tailing the Interaction with Users in Web Stores

來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/12443821/viewspace-605688/,如需轉載,請註明出處,否則將追究法律責任。

相關文章