Pagerank Hesaplama

google pagerank

Pagerank hesaplaması temel olarak aşağıdaki gibi tanımlanır. A1, A2, …, An B sitesindeki sayfaya bağlantı veren sayfalar olsun. PR(Ak)’yı da Ak sayfasının pagerank değeri olarak kabul edelim. N(Ak) ise Ak sayfasının dış sayfalara verdiği link (bağlantı) sayısı olsun. d ise 0 ile 1 arasında değişen ve genellikle 0.85 olan bir katsayı olsun.

Bu bilgiler doğrultusunda pagerank formülü şöyle olacaktır:

PR(B)=(1-d)+d*(PR(A1)/N(A1)+…+PR(An)/N(An))

Bu formül karmaşık gelebilir. Çünkü hesaplamayı yapmak için daha önceden başka bir sitenin pagerankını hesaplamak gerekiyor. Aslında bu sorunun çözümü basittir. Tüm sayfa rütbelerini belirli bir değerde sabitlersek bu sorun çözülür. Her sayfa için aynı değeri verdiğimizde bu değeri kaç alırsak alalım sonuç değişmeyecektir. Formül kendisini tekrarlamaya devam ettikçe sonuç bir önceki hesaplamaya bağlı olarak tekrar hesaplanacaktır. İşlem ilerledikçe pagerank değerleri rayına oturacaktır. Bunun haricinde pagerank değeri bir ziyaretçinin sayfada harcadığı süreye de bağlı olabilir. Şimdi Pagerank hesaplanmasına ait bir örnek vermek istiyorum. Örneğimizde 4 adet Web sitesini ele alalım. A, B, C, D siteleri… Tüm işlemleri bu 4 site üzerinde yapalım. Bu nedenle her bir sitenin başlangıçta 0,25 değerinde puan kazandırdığını varsayıyoruz. Örneğimizde B, C ve D siteleri sadece A sitesine bağlantı veriyor. Her bir sitenin A sitesine kazandırdığı 0,25 değerindeki puanları topluyoruz. Bu durumda tüm puanlar, bağlantıların hepsini alan A sitesinde toplanmış oluyor.

PR(A)=PR(B)+PR(C)+PR(D)

Şimdiki örneğimizde B sitesinin A ve C sitelerine bağlantı verdiğini ve D sitesinin de diğer 3 siteye geri bağlantı verdiğini varsayalım. Bu nedenle geri bağlantı değeri bir sitedeki dışarıya bağlantı sayısı arttıkça düşer. Dolayısıyla daha önceki örneğimizde 0,25 değerinde puan kazandıran B sitesi, şuan A sitesine 0,125 değerinde PR kazandırıyor. Çünkü B sitesinin 0,25 değerindeki puanı bağlantı verdiği A ve C siteleri arasında paylaştırılıyor. Her üç siteye bağlantı veren D sitesi ise 0,25 değerindeki puanı üç site arasında paylaştırıyor. Bu nedenle D sitesinin A sitesine kazandırdığı puan 0,083’dür.

En son verdiğimiz örneğe göre her bir sitenin kazandığı PR değerini aşağıdaki formül ile tahmin edebiliriz:

PR(A)=[PR(B):2]+[PR(C):1]+[PR(D):3]
PR(A)=0,125+0,25+0,083
PR(A)=0,458

PR(B)=[PR(D):3]
PR(B)=0,083

PR(C)=[PR(B):2]+[PR(D):3]
PR(C)=0,125+0,083
PR(C)=0,208

PR(D)=0

Örnekte görüldüğü gibi en çok puanı toplayan A sitesidir. D sitesi ise bu üç siteden hiç bağlantı almadığı için puan almamıştır. Ancak D sitesi örnekte yer almayan X sitelerinden edindiği 0,25 puanı A, B ve C siteleri arasında paylaştırmıştır. Buradan şunu anlıyoruz ki iki sitenin geri bağlantı sayısı aynı bile olsa PR değeri, geri bağlantı veren sitelerin kazandırdığı puana göre belirlenmektedir.

PR değeri aynı olan iki site varsayın: A ve B. Sizin siteniz de C olsun. A ve B siteleri için standart PR puanının 0,25 olduğunu varsayalım. A sitesi sadece C sitesine geri bağlantı versin. B sitesi ise hem C sitesine hem de D, E, F, G sitelerine geri bağlantı versin. Bu durumda sizin sitenize en çok puan kazandıran site sadece sizin sitenize geri bağlantı veren A sitesidir. A sitesi C sitesine 0,25 kazandırırken; B sitesi 0,25 değerindeki puanı C, D, E, F ve G siteleri arasında paylaştırdığı için sizin siteniz olan C’ye 0,05 puan kazandırır. Netice itibariyle bazen bir siteden alacağınız puan onlarca siteden aldığınız puandan daha fazla olabiliyor.

Share on FacebookShare on Google+Tweet about this on TwitterShare on LinkedInPin on Pinterest
0.00 avg. rating (0% score) - 0 votes

Sevebilirsin...

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir