PageRank'ın Matematiği

[u][b] PageRank'ın Matematiği[/b][/u]

Pagerankın ilk çıkış mantığı şu cümle ile özetlene bilir "insanların link verdigi site kötü site olamaz.insanlar bir siteye link veriyorsa, bu site iyi bir site olmalı..."
işte google bu sihirli cümleden yola çıkarak kuruldu, gelişti, gelişmeye devam etmektedir.Google' un ilk yıllarında çogu kişi, pagerankın gücünün farkında degildi ve pek önemsemedi.Rakip arama motorları yahoo, msn ve altavista sanal dünyadaki milyarlarca sayfanın birbiri ile etkileşimine dayanan pagerank degerinin hesaplanmasının imkansıza yakın oldugunu ve sistem kaynaklarının boşuna bir ugraş içinde olacağı görüşünde birleşiyorlardı.Ancak yapılan deneyler sonucunda fark edildi ki gerçektende pagerank önemli bir etken idi.BBu yazımızda pagerankın matematiksel modellemesi üzerinde durulacaktır.
Pagerankın Google tarafından açıklanan formülü aşağıdadır:
PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))

formüldeki degişkenler şunlardır:

PR(A)= A sitesine ait pagerank degeri
d = �damped down� faktörü denilen özel bir katsayı ve 0.85 kabul edilmekte.
PR(Tn) = A sitesine link veren herhangi bir sitenin pagerank degeri.
C(Tn) = A sitene link veren herhangi bir sitedeki link sayısı.

Google yaptıgı açıklamalarda şunu belirtmiştir ki, sanal evrendeki tüm sitelerin gerçek pagerank degerleri toplamı 1 sayısına eşit oldugu kabul edilmiştir.Bizde bu yaklaşımla yola çıkarak degişik linkleşme şemalarının pagerank degerine katkılarını inceleyecegiz.İlk örnegimizde linkleşmenin en basit hali olan karşılıklı link degişiminin etkilerini görelim.Yapacağımız tüm örneklerde her sitenin pagerank degeri ilk başta 1 kabul edilmiştir.

Pagerank örnek 1

[img]http://img95.imageshack.us/img95/5256/pagerank19wz.gif[/img]


= 0.85

PR(A)


= (1 � d) + d(PR(B)/1)

PR(B)


= (1 � d) + d(PR(A)/1)

Degerleri yerine koyarsak :
PR(A) yani A sitesine ait pagerank degeri 1 kabul edildi.
d= 0.85 katsayı degerinde oldugunu google bize söylüyor.
PR(B) yani B sitesine ait pagerank degeri 1 kabul edildi.
C(Tn) =1 A sitesinden ve B sitesinden dış dünyaya verilen link sayısı 1 oldugundan 1 alınırsa

PR(A)


= 0.15 + 0.85 * 1
= 1

PR(B)


= 0.15 + 0.85 * 1
= 1

Eger üsteki şekildeki iki siteninde ilk başta pagerank degerlerinin sıfır oldugunu kabul edip tekrar formulde yerine koyarsak:

Birinci iterasyon sonucu




PR(A)


= 0.15 + 0.85 * 0
= 0.15

PR(B)


= 0.15 + 0.85 * 0.15
= 0.2775

Yeni iterasyonlar için yani buldugumuz degerleri tekrar tekrar formulde yerine koyarsak ve işleme devam edersek

ikinci iterasyon sonucu




PR(A)


=0.15 + 0.85 * 0.2775
= 0.385875

PR(B)


= 0.15 + 0.85 * 0.385875
= 0.47799375
3 kez işleme devam edersek

üçüncü iterasyon sonucu




PR(A)


= 0.15 + 0.85 * 0.47799375
= 0.5562946875

PR(B)


= 0.15 + 0.85 * 0.5562946875
= 0.622850484375

Eger yine iki site içinde ilk baştaki pagerank degerliklerini 40 kabul edersek yani PR(A)=40 ve PR(B) =40 kabul edilirse

Birinci işlem sonucu




PR(A)


= 0.15 + 0.85 * 40
= 34.25

PR(B)


= 0.15 + 0.85 * 0.385875
= 29.1775

Hesaplamaya devam edersek

Birinci iterasyon sonucu




PR(A)


= 0.15 + 0.85 * 29.1775
= 24.950875


pagerank deger 1 sayısına yaklaşıyor

PR(B)


= 0.15 + 0.85 * 24.950875
= 21.35824375


pagerank deger 1 sayısına yaklaşıyor

İlk pagerank degerliklerini 40 kabul etsek bile yani 1 rakamından büyük bir sayı olsa bile iterasyon sonucu en basit linkleşme şeklinde bile belli iterasyon basamağı sonucu, Google un kabul ettiği 1 rakamına ulaşıyor.
Google her sitenin gerçek pagerank degerini yani iki linkin birbiri ile etkileşimini hesaplaya bilmek için 40 kez iterasyon yapmaktadır.
Pagerank örnek 2
[img]http://img105.imageshack.us/img105/9531/pagerank21ke.gif[/img]
Örnek 2 deki şekildeki bir linkleşme şeması sonucu yapılan 40 iterasyon sonucu her sitenin kazandıgı pagerank degeri aşağıdaki gibidir.
ilk başta tüm sitelerin pagerank degeri 0 kabul edildi.
[img]http://img98.imageshack.us/img98/5180/pagerank34qb.gif[/img]

Özet:En basit linkleşme şeklinin bile 40 iterasyon sonra 1 degerine ulaştığını varsayarsak:
D sitesi hiç bir siteden link almadıgından dolayı ilk başta 0 olan pagerank degerini 0.15 degerinde kalmıştır.
C sitesi 3 ayrı siteden link aldığından dolayı ve dışarıya sadece 1 link verdiginden dolayı pagerank degeri 1.58 olmuştur.
B sitesi 1 siteden link almış ve bir siteye link vermiş olmasına ragmen, mevcut pagerank degeri olan 1 sayısının bile altına inmiştir. Gelen linkin, giden linki hiç bir zaman eşitlemediğini bu örnek gösteriyor.
pagerank örnek 3
[img]http://img98.imageshack.us/img98/5711/pagerank43qn.gif[/img]
Örnek 3 deki şekildeki bir linkleşme şeması sonucu yapılan 40 iterasyon sonucu her alt sayfanın ve dost sitenin kazandıgı pagerank degeri aşağıdaki gibidir.
[img]http://img231.imageshack.us/img231/5561/pagerank56nw.gif[/img]
Özet:
Eger başka sitelere link verirsek kendi alt sayfalarımıza gidecek pagerank degerini onlara vermiş olmaktayız. örnek 4'ü incelerseniz görürsünüz.

Pagerank örnek 4
[img]http://img99.imageshack.us/img99/9156/pagerank67ez.gif[/img]
Yine ilk başta tüm sayfalarımızın pagerank degeri sıfır kabul edilirse ve şekildeki gibi bir linkleşme yaparsak pagerank kazanımımız şekildeki gibi olur.

Pagerank örnek 5
[img]http://img99.imageshack.us/img99/4479/pagerank76vn.gif[/img]
Örnek 4 ün değişik bir şekli.A sitesi bizim sitemize karşılıksız olarak link vermekte ve sisteme pagerank girişi olmaktadır yani formulün pay kısmına yeni bir deger gelmiştir.Hem ana sayfamızın hemde alt sayfalarımızın pagerank degeri artmıştır.Örnek 4 de ana sayfamız 1.92 degerine sahip iken, sitemize aldığımız bir karşılıksız link sonucu ana sayfamızın pagerank degeri 3.31 degerine ulaştı.

Genel Özet
1- Çok fazla dost siteniz olursa, alt sayfalarınıza gidecek pagerank degeri dost sitelerinize gider.Alt sayfalarınız güçsüz kalır.
2- Eğer bencillik yapar kimseye link vermezseniz, web'in ağ olma özelliğini bozduğunuzdan dolayı google sitenizi cezalandırır.Pagerankınızın artmasını beklerken dahada düşer. Googlebot mutlaka sitenizden, başka sitelere kolaylıkla geçip gidebilmelidir.
3- Buradaki örnekler çok basit düzeyde olmasına ragmen her sayfanın birbiri ile link alışverişinin dogru hesaplanabilmesi için 40 iterasyon yapıldıgını görmektesiniz.Google milyarlarca sayfanın birbiri ile etkileşimini hesaplamak için yaptıgı matematiksel hesapları düşünürseniz, olayın boyutunu daha iyi kavrarsınız ve niye toolbar pagerankının güncellemesi 3 ayda bir güncelleniyor sorusunun cevabını kendinizde bulabilirsiniz. Çünkü trilyonlarca matematik işleminin dogru olarak hesaplanması yada dogruya yakın hesabı ancak bu kadar zaman alıyor...

[url=http://www.bilisimplatformu.com/forum/PageRankand39n-Matematii-t14.html]bilisimplatformu[/url]
Hanci.org sizlere daha iyi hizmet sunmak için çerezleri kullanıyor.
Hanci.org sitesini kullanarak çerez politikamızı kabul etmiş olacaksınız.
Detaylı bilgi almak için Gizlilik ve Çerez Politikası metnimizi inceleyebilirsiniz.