Posted by: TARONO on: May 31, 2008
衝 !
Posted by: TARONO on: May 12, 2008
TiVo application: It is a TV show recommender system implemented in decentralized architecture. Users’ preference on shows was presented in the form of rating (from score -N to +N) and the preference score was rated in the client side. The TiVo server periodically aggregate the clients’ rating and send the rating table via ring mechanism [...]
Posted by: TARONO on: November 17, 2007
Tagging 的部份 : 由於CF的運算是要採取 co-rated items 的方式去做similarity比較 如果單純以 paper 作為 item,則使用者彼此之間的co-rated的item set 一定不會很大,甚至很可能為空集合,而無法計算similarity。 而我希望能藉由Tagging的方式,把一篇paper擴增成讓許多Tags 來描述這篇paper的特性,利用這種方式,即使是兩篇不同的paper ,但是他們屬於同一類型,很可能就會被使用者們歸類為同一個Tag。 因此比起傳統用SVD來降低Rating Table的維度(維度是要用tune的), 來增進co-rated的機會,在這邊我是利用Tag的方式來增進 co-rated 的機會(維度是由使用者的Tagging情況決定)。當然很可能Tagging Space不一定會小於Item Space,但是我的目的只是要增進使用者間 有意義的co-rated的機會。(在此co-rated意思為兩個使用者擁有同一個tag) 而利用Tag的方式是否會改善傳統以paper(item)方式的co-rated機率 就是我要做實驗來驗證的。 Social Recommendation 的部份 : 傳統的CF運算是針對一個使用者(Target User)的行為,來找出系統中行 為跟他相似的 ” 朋友 “,進而分析他朋友喜歡的東西,來推薦給我們的Target User。因此CF定義朋友的方式,是採取行為間的相似度高的那群人來當作 我們的 Target User 的朋友(儘管Target User實際上不認識他們),所以有 些學者也把CF歸類為Social Recommendation的一種方式。而在我的Proposal 中所提及的Social Recommendation除了會利用到CF的運算,此外還會考 慮使用者”自行加入”的朋友,在此的”朋友”就是使用者認識的朋友(很可能是現實 世界認識,或是網路世界認識)。而在CiteULike資料庫中,有提供組Group的 功能,同一個Group的人們(也許興趣相似或是不相似),彼此之間都可以當作 是朋友關係。我希望結合CF的運算與使用者自行定義的Friends的方式來增進 Recommendation List的diversity(多樣化),因為使用者自行定義的Friends很可 能在CF的運算中並不會被納入為”朋友”的考量。而我所提的Social Recommendation 的方法是否可以增進傳統用CF的方式之diversity,也是需要做實驗來驗證。 [...]
Posted by: TARONO on: July 10, 2007
How to measure the popularity of a product can be discussed in three dimensions : 1. The quality of a product 2. The frequency of a product’s being purchased 3. The strong support of a product (big fans)
Posted by: TARONO on: April 29, 2007
Paper A. Blum and M. Furst. Fast planning through planning graph analysis. In Proceedings of the International Joint Conference of Artificial Intelligence, pages 1636-1642, August 1995. Report The paper proposed a mechanism for solving planning problem using a compact structure called planning graph. The planner Graphplan used in this paradigm can always return the shortest [...]
Posted by: TARONO on: April 17, 2007
Netflix data set : 有好幾十億的資料,若要轉成 user-item matrix 做分析,則會因為 scale 太大而難以處理。 Solution : Apply SVD ( Singular Vector Decomposition) to the matrix. SVD 可以把原始的 matrix 降至更低維度,並且保持一些性質 (待check)。 想法 : 幫每個movie定義一個 feature vactor,vector中的每個tuple代表 此movie某方面的性質,比如動作成分佔多高要素。相對的每個user也有 preference vector,vector中的每個tuple代表對movie中的每個性質之喜 好程度。 So let user A’s preference vector is = ( 1 , 2 , -1 ) let Movie M’s feature vector [...]
Posted by: TARONO on: March 30, 2007
之前看了學長的 Time weighted CF 演算法成功了改進傳統 CF演算法的Accuracy。心中還是有些疑惑,依照學長的論 點是,一個人早期的 rating 資料的參考價值,不會比現在的 rating 資料的參考價值來的高。因此他設計了一個參考價值 依照時間飄逝 decrese 的曲線,也就是距離目前時間點愈近 則參考價值就比較高,愈遠就參考價值愈低。比如今天某位 使用者所做的 rating 參考價值是 1 ,則昨天此位 user 所做的 rating參考價值可能就是 0.9,如此把參考價值乘上實際的rating 數值所得除來的數字是比較具有參考性的。利用這種想法稍微 改了一下 CF 演算法的核心部份,準確度就上升了。但是目前 在 RS 系統上改善 Accuracy 的主要盲點是在於大家都會想出一 套新的方法來改變舊有的演算法,之後宣稱這個方法是可以提 升準確度的。但是卻沒辦法去證明說如果要改善準確度用這些 新方法就可以真的達到目的。 As known as if p then q ( p -> q) , we can not guarantee that q -> [...]
Posted by: TARONO on: March 30, 2007
TO : 郵件的主要接收人 CC : 全名是 Carbon Copy ,副本。 BCC : 全名是 Blind Carbon Copy,密件副本。 在分析 Mail 所建立的 social networks 時,郵件彼此傳送之間 傳送者與接收者的重要性可以由 TO , CC , BCC 看出。 比如一 封 MAIL 如果 TO 很多人,則這封郵件對於每個人的重要性就 沒有來比TO 單一個人來的高。當然,BCC給某個人,則代表 這封郵件對那個BCC接收者顯得更唯重要,或是說寄信者相信 BCC的接受者才會利用BCC這欄位。 在分析 Social network 所做的 Visualization 目的是為了讓使用 者能更直觀的看出人與人之間的關係,比如兩個 Nodes之間的遠 近就可以表示這兩個Nodes之間的相似度或是親密度或是相關度等。 但是當 Network 的 Scale 很大時,做Visualization可能就會遭遇呈現 的問題吧,想像著要把好幾千人所組成的 Network 秀在一個小螢幕上 [...]
Posted by: TARONO on: March 29, 2007
How to make user trust our recommender system is a crucial design goal . Image that if a RS always recommend items that a user have never seen , so the items will be strange to the user. In other words , the RS will not be so friendly to the user . So how [...]
Posted by: TARONO on: March 29, 2007
Pattern recognition — the act of taking in raw data and taking an action based on the “category” of the pattern . Segmentation operation in which the images of different fish are somehow isolated from one another and from the background. 比如把某隻魚從其他的魚中獨立出來並且去除背景,此動作叫做Segmentation。 Feature 的好壞 : 當一個 feature f1 和 feature f2 有相關性 ( 比如是正相關 ) [...]