mokotw


什麼是Comment Spam?

Posted in what 由 mokotw 於 二月 14, 2007

什麼是comment spam就是垃圾留言

那什麼是Trackback spam就是垃圾反向連結

http://en.wikipedia.org/wiki/Spam_in_blogs
http://www.sixapart.com/pronet/comment_spam

廣告

什麼是SPAM ?哪些網頁會被認定為SPAM ?

Posted in what,yahoo 由 mokotw 於 二月 14, 2007

所謂的SPAM是指當搜尋結果中出現不相關的網頁資訊,或某些網站為了吸引網友點選,因此藉由一些網頁編輯技巧,以及過度不適當的網站行銷策略,企圖影響或欺騙搜尋引擎,使搜尋結果中出現與關鍵字不相關的資訊。

認定為SPAM網站的定義如下:

網頁直接轉址,連結到某一特定網站或網域,企圖提高該網站在搜尋引擎的排名

網友看到的網站內容與搜尋引擎看到的網站內容不同

多個網站提供相同內容

連結網頁後,出現大量彈跳視窗,影響網友瀏覽網站

網頁的Metadata中含有大量關鍵詞
請注意若是您的網站內容含有企圖影響或欺騙搜尋引擎的資訊,將會影響您網站在搜尋引擎中的排序,建議您移除這些資料。

via:http://tw.help.yahoo.com/ysearch/ysearch_faq_sea-41.html

什麼是PageRank

Posted in what 由 mokotw 於 一月 29, 2007

PageRank,網頁排名,又稱網頁級別或Google左側排名。是一種由搜索引擎根據網頁之間相互的超連結計算的網頁排名。它經常和搜索引擎優化有關。 PageRank系統被Google用來體現網頁的相關性和重要性。Google的創始人拉里·佩奇和謝爾蓋·布林1998年在史丹福大學發明了這項技術。見Google puts it:

PageRank通過網路浩瀚的超連結來往來確定一個頁面的等級。 Google把從A頁面到B頁面的連結解釋為A頁面給B頁面投票 Google根據投票來源(甚至來源的來源,即連結到A頁面的頁面)和投票目標的等級來決定新的等級,簡單的說,一個高等級的頁面可以使其他低等級頁面的等級提升。

PageRank演算法

PageRank讓連結來"投票"

一個頁面的"得票數"由所有鏈向它的頁面的重要性決定。到一個頁面的超連結相當於對該頁投一票。一個頁面的PageRank是由所有鏈向它的頁面(“鏈入頁面")的重要性經過遞歸演算法得到的。一個有很多鏈入的頁面會有很高的等級,相反如果一個頁面沒有任何鏈入頁面,那麼它沒有等級。

2005年初,Google為網頁連結推出一項新屬性"nofollow",令網站管理員和網誌作者可以做出一些Google不會跟蹤的連結;這些連結不算作"投票". nofollow的設置可以抵制評論垃圾。

Google工具條上的PageRank從0到10. 它似乎是一個對數標度演算法。這個演算法的細節是未知的。PageRank是Google的商標. 這個名字是否與Google創始人拉里·佩奇(Page從此而來)有關,又或者只是巧合,仍然是個謎。 PageRank技術已經申請專利。
PageRank演算法中的點擊演算法是由Jon Kleinberg提出的.

PageRank演算法

簡單的

假設一個由4個頁面組成的小團體:A, B, CD.如果所有頁面都鏈向A,那麼APR (PageRank)值將是B, C and D的和.

PR(A) = PR(B) + PR(C) + PR(D)

繼續假設B也有連結到C, 並且D也有連結到包括A的3個頁面。一個頁面不能投票2次。所以B給每個頁面半票. 以同樣的邏輯,D投出的票只有三分之一算到了A的PageRank上.

PR(A)= \frac{PR(B)}{2}+ \frac{PR(C)}{1}+ \frac{PR(D)}{3}

換句話說,根據鏈處總數平分一個頁面的PR值.

PR(A)= \frac{PR(B)}{L(B)}+ \frac{PR(C)}{L(C)}+ \frac{PR(D)}{L(D)}

最後,所有這些被換算為一個百分比再乘上一個係數q。由於下面的演算法,沒有頁面的PageRank會是0. 所以,Google通過數學系統給了每個頁面一個最小值1 − q.

PR(A)=\left( \frac{PR(B)}{L(B)}+ \frac{PR(C)}{L(C)}+ \frac{PR(D)}{L(D)}+\,\cdots \right) q + 1 - q

所以一個頁面的PageRank是由其他頁面的PageRank計算得到. Google不斷的重複計算每個頁面的PageRank. 如果您給每個頁面一個隨機PageRank值(非0),那麼經過不斷的重複計算,這些頁面的PR值會趨向於正常和穩定。 這就是搜索引擎使用它的原因。

完整的

這個方程式引入了隨機瀏覽的概念,即有人上網無聊隨機打開一些頁面,點一些連結。一個頁面的PageRank值也影響了它被隨機瀏覽的機率。為了便於理解,這裡假設上網者不斷點網頁上的連結,最終到了一個沒有任何鏈出頁面的網頁,這時候上網者會隨機到另外的網頁開始瀏覽。

為了對那些有鏈出的頁面公平,q = 0.15(q的意義見上文)的演算法被用到了所有頁面上, 估算頁面可能被上網者放入書籤的機率。

所以,這個等式如下:

{\rm PageRank}(p_i) = \frac{q}{N} + (1 -q) \sum_{p_j} \frac{{\rm PageRank} (p_j)}{L(p_j)}

p1,p2,…,pN是被研究的頁面, M(pi)是鏈入pi頁面的數量, L(pj)pj鏈出頁面的數量, 而N是所有頁面的數量。

PageRank值是一個特殊矩陣中的特徵向量。這個特徵向量為

\mathbf{R} = \begin{bmatrix} {\rm PageRank}(p_1) \\ {\rm PageRank}(p_2) \\ \vdots \\ {\rm PageRank}(p_N) \end{bmatrix}

R是等式的答案

\mathbf{R} =  \begin{bmatrix} {q / N} \\ {q / N} \\ \vdots \\ {q / N} \end{bmatrix}  + (1-q)  \begin{bmatrix} \ell(p_1,p_1) & \ell(p_1,p_2) & \cdots & \ell(p_1,p_N) \\ \ell(p_2,p_1) & \ddots & & \\ \vdots & & \ell(p_i,p_j) & \\ \ell(p_N,p_1) & & & \ell(p_N,p_N) \end{bmatrix}  \mathbf{R}

如果pj不鏈向pi, 而且對每個j都成立時,\ell(p_i,p_j)等於0

\sum_{i = 1}^N \ell(p_i,p_j) = 1,

這項技術主要的弊端是,舊的頁面等級會比新頁面高,因為新頁面,即使是非常好的頁面,也不會有很多連結,除非他是一個站點的子站點。

這就是PageRank需要多項演算法結合的原因。PageRank似乎傾向於維基百科頁面,在條目名稱的搜索結果中總在大多數或者其他所有頁面之前。原因主要是維基百科內相互的連結很多,並且有很多站點鏈入。

Google經常處罰惡意提高PageRank的行為。Google究竟怎樣區分正常的連結交換和不正常的連結堆積仍然是商業機密

「PageRank」的文獻信息
文章名稱:PageRank
作者:維基百科編者
出版社:維基百科,
最後更新日期:2007年01月8日16:41(協調世界時
引用日期:2007年01月29日23:49(協調世界時
永久連結:http://zh.wikipedia.org/w/index.php?title=PageRank&oldid=3288831
文章版本編號:3288831
以下是幾種常用的參考文獻格式,請確保格式符合您的需求。

QR Code (Quick Response Code)

Posted in what 由 mokotw 於 一月 28, 2007

這種編碼名稱為 QR Code (Quick Response Code) ,有人稱為"二維行動條碼",這種可供掃瞄的碼是由日本 Denso Wave公司發明的,一塊小小的圖碼可以儲存1000多個字,內容可為網址,折扣券號碼,班機時刻,或一段文字或資料,只要長度合乎規定的文字都可以儲存,方便的地方就是可以用手機掃瞄讀取,可以用手機將網址掃瞄,然後直接前往該網頁,或任何資料或號碼不用再鍵入,掃瞄即可,使用上非常方便,現正如火如荼流行中。
參考資料 http://www.rikunabi2007.com/RN/07/KDBG/01/0086501007/DETAILA/I001/index.html

什麼是網路上的”點閱詐欺”?

Posted in what 由 mokotw 於 一月 28, 2007

在Google與Yahoo的搜尋關鍵字服務上,提供了可以刊登以實際效果(點閱次數)計費的廣告。

有些網路廣告主的競爭同業發現此一商業模式的漏洞,使用線上機器人程式(bots)或是人工方式,點閱網路廣告主刊登的連結,以快速消耗其廣告預算。這種行為就叫做「點閱詐欺」 (click fraud)

特殊的地方在於乍看之下是損人不利己的行為,所以在原先設計這種廣告付費模式時並沒有想到。而且此項詐欺行為牽涉到上億美金的廣告費用及營收,且影響整個網路廣告的效度,最終可能導致整個廣告費用模式的崩潰,必須尋求新的解決方案。

點閱詐欺惹火搜尋廣告主
CNET新聞專區:Stefanie Olsen報導 7/3/2005
(唐慧文) http://taiwan.cnet.com/news/softwar…20096986,00.htm

一家醫療付費軟體公司的總裁Tammy Harrison說,她是網路點閱詐欺的受害者,並呼籲業者想辦法制止這種詐騙行為。

Harrison發現,對手公司不斷點閱她在Google與Yahoo搜尋關鍵字服務上刊登的廣告。對手耍此伎倆的目的,是讓她的廣告預算失血,並提昇對手公司在網頁上的排名順序。於是她把蒐集到的證據寄給已實施反詐欺政策的兩大搜尋引擎公司,獲得退回一部分的廣告費,並且讓一家搜尋公司把對手列為拒絕往來戶。

在紐約舉行的搜尋引擎策略(SES)會議上,任職於2KMedicalBilling.com的Harrison說:「我花了200小時的工夫,才追蹤到這名詐欺之徒,而且損失了至少10萬美元的銷售額。但我拿回多付的錢,儘管只取回一部分,不是全部。」

另一聽眾呼應說,他的公司也是網頁點閱詐欺的受害者,因此損失將近30萬美元。他聲稱:「這種騙術是經商的一部分,因為若你開始對搜尋引擎公司提出告訴,他們會切斷你的網站流量。」

在搜尋服務業,點閱詐欺(click fraud)是按廣告效果付費所面臨的現實問題。由於網路付費搜尋廣告有效地引導消費者找到有興趣的產品與服務,這塊廣告市場每年的銷售額估計可達40到 50億美元,成為Google和Yahoo等公司的金母雞,但也因為獲利可觀,通常難免引來宵小之徒。

詐欺者利用行銷業者必須按照連結廣告點閱次數付錢給搜尋引擎公司的原則,從中牟利。

例如,消費者若以關鍵字「醫療付款軟體」搜尋,並且點閱搜尋結果頁上刊登的廣告主網站連結,則每點閱一次,廣告主估計就得付8美元給搜尋服務公司。

某些個案中,那些費用所得可與聯合刊載相關廣告的第三方網頁發行者分享。而且,醫療、金融或法律等行業的廣告收費標準較高,以致鎖定這類業者仿冒的網站特別多,意圖向Google等網路廣告服務抽取佣金。

Google、Yahoo等搜尋廣告提供者未列出點閱詐騙衍生的損失與退款金額,但據專家私下估計,此數可能占廣告銷售額的5%到20%不等。

「這是為數可能高達十億美元的問題,」新興搜尋引擎公司Snap.com總裁Tom McGovern說。

對廣告主來說,點閱詐欺特別令人頭痛,因為他們必須定期監看自家網站的流量以及廣告活動的效果,以揪出詐騙之徒,然後向賣廣告的搜尋引擎公司要求退款。

這類詐欺活動通常由線上機器人程式(bots)代勞,由程式設定自動點閱某廣告主刊登的連結,所以可能難以偵察得到。也可能由競爭對手公司的職員以人工點閱的方式為之。

因此,出席SES會議的公司紛紛呼籲各界謀求對策解決此問題。

例如,Snap.com上周起推出新的廣告系統,讓廣告主只根據消費者受某促銷活動吸引而且實際採取行動的次數收費,這收費方式稱為「按行動計費」 (cost per action)的廣告方案。此服務可讓廣告主出價標購在Snap.com搜尋結果頁上登廣告的版面,但只在消費者實際購買產品或服務的情況下,才需要支付廣告費。

其他分析公司,包括Clicklab及ClickDefense.com,也已推出專用的詐欺監看工具。

與會者建議廣告主和搜尋引擎公司訴諸法律途徑,以制止點閱詐欺歪風。

以Google為例,這家搜尋引擎巨人去年秋季就對一個涉嫌者提出告訴。Google控告 Auction Experts International濫用Google的廣告網路牟利。這起官司正在加州聖塔克拉拉法院待審中。

Alchemist Media創辦人兼點閱詐欺專家Jessie Stricchiola說,通常,對涉嫌詐欺的人士寄發「勒令停止通知函」(cease-and-desist letter),即可收到嚇阻之效。對2KMedical的Harrison來說,這類警告函亦可引起第二家搜尋引擎的注意,以遏制對手公司的不法行徑。

請參考:
http://www.emarketing.org/showthread.php?s=6cfd53bbd5f4c8224f19af492d8f11f9&p=221

作者:Allen。以上資料為本人提供,原文為英文者為本人翻譯,著作權及合理使用聲明請見作者自我介紹。引用須包括完整的這一列,

參考資料來源網址為:
http://tw.knowledge.yahoo.com/question/?qid=1005040701229