PageRank — сімейство алгоритмів оцінки важливості вебсторінок за допомогою розв'язання систем лінійних рівнянь. Для кожної сторінки обчислює дійсне число, чим більше число — тим «важливіша» сторінка.
Замість прямого підрахунку кількості посилань PageRank інтерпретує посилання сторінки A на сторінку Б як голос сторінки A на користь сторінки Б. Після цього PageRank оцінює рейтинг сторінки відповідно до кількості отриманих голосів.
PageRank також враховує значимість кожної сторінки, що отримала голос, адже голоси деяких сторінок є важливішими, і відповідно до цього підвищується значущість сторінки, посилання на яку вони містять. Важливі сторінки отримують більш високу оцінку PageRank і відображаються на перших позиціях результатів пошуку. Для визначення значущості сторінки технологія Google використовує колективний інтелект всесвітньої мережі. Людина не бере участі в обробці результатів. Пошукова система Google не спотворює інформацію про позиції платою за результати пошуку.
Найбільший пейджранк серед українських ресурсів має Українська Вікіпедія, у якої він дорівнює 8, а також Українська правда та Газета День — по 7.[]
За основу PageRank був обраний академічний підхід оцінки важливості публікації автора по числу її згадок в бібліографічних посиланнях інших авторів. Для адаптації до застосування в Інтернет в алгоритм були внесені наступні зміни: вага кожного посилання враховується індивідуально і нормується за кількістю посилань на сторінці. Крім того, PageRank може бути інтерпретовано в термінах випадкового блукання.
Історія
Ідея розв'язання проблеми аналізу зв'язних даних шляхом обчислення власного вектора була запропонована в 1976 році Габріелем Пінскі та Френсіс Нарина, які працювали над складанням наукометричних рейтингів наукових журналів. та в 1977 році Томасом Сааті в його концепції методу аналізу ієрархій, який зважував альтернативні варіанти.
PageRank був створений в Стенфордському університеті Ларрі Пейджем і Сергієм Бріном в 1996 році в рамках науково-дослідного проекту про новий вид інформаційно-пошукової системи. Сергій Брін висловив ідею, що інформацію в Інтернеті можна впорядкувати в ієрархію за «популярністю посилань»: чим більше посилань на сторінку, тим вищий у неї ранг. У створення нового алгоритму також зробили внесок і Террі Виноград. Перша стаття, в якій описано PageRank і початковий прототип інформаційно-пошукової системи Google, була надрукована в 1998 році: Трохи згодом Пейдж і Брін заснували Google Inc., компанію, що стоїть за інформаційно-пошуковою системою Google. Хоча PageRank є лише одним з чинників, що впливають на результати пошуку, цей алгоритм досі забезпечує основу для всіх інструментів вебпошуку компанії Google.
Назва «PageRank» поєднала прізвище одного з винахідників, Ларрі Пейджа (англ. Page), а також концепцію вебсторінки. PageRank — зареєстрована торговельна марка компанії Google, а алгоритм було запатентовано U.S. Patent 6 285 999. Однак, цей патент належить Стенфордському університету, а не компанії Google. Google має ексклюзивні права на ліцензійне використання патенту Стенфордського університету. Натомість, університет отримав 1,8 млн акцій Google за дозвіл використання патенту; акції були продані в 2005 році за $336 млн.
PageRank був створений під впливом алгоритму аналізу цитованості, роботу над яким розпочав у 1950-ті в університеті Пенсільванії, та розроблений в університеті Падуї. Того ж року, коли був оприлюднений алгоритм PageRank (1998), опублікував свою роботу про алгоритм HITS. Засновники компанії Google посилаються на роботи Гарфілда, Мархіорі та Клейнберга у власних публікаціях.
Порівняно невелика інформаційно-пошукова система розробки Робіна Лі, , що належала компанії IDD Information Services, вже в 1996 році використовувала схожий алгоритм для ранжування сайтів та сторінок. Використаний в RankDex алгоритм був запатентований в 1999 році U.S. Patent 5 920 859 і згодом був використаний у заснованій в Китаї Лі пошуковій системі Baidu. Ларрі Пейдж посилався на роботу Лі в деяких патентах в США.
Обчислення PageRank
Огляд
Основною метою нового алгоритму було поліпшити якість відповідей на пошукові запити. Пошукові системи того часу значною мірою покладались на індексування сторінок за ключовими словами. Цим скористались зловмисники для маніпуляції результатами пошуку методом пошукового спаму. Розробники PageRank зазначили, що станом на листопад 1997 року, лише одна із найпоширеніших пошукових систем була здатна вказати власну сторінку в перших 10 результатах при запиті на власну назву (була здатна знайти сама себе).
Запропонований алгоритм, натомість, брав до уваги структуру і текст гіперпосилань. При цьому:
- Алгоритм PageRank моделював випадкову подорож користувача інтернет починаючи з випадкової сторінки. Чим більше випадкових відвідувачів діставались сторінки, тим вище її рейтинг. Розробники припустили, що в такий спосіб вдасться уникнути проблем зі спамом за ключовими словами.
- Вміст сторінки оцінювали не лише за ключовими словами в ній, а й в сторінках, що на неї посилаються. Розробники припустили, що зловмисникові буде важче спотворити вміст сторінок, що посилаються на його сторінку, тільки якщо він не контролює інші сторінки.
Значення PageRank для сторінки A обчислюється за такими правилами: нехай — сторінки, що посилаються (цитують) сторінку A. Алгоритм також використовує коефіцієнт демпінгу d, значенням якого знаходяться в проміжку між 0 та 1, та зазвичай має значення 0.85. Функція C(T) дорівнює кількості посилань, що виходять зі сторінки T. Тоді значення PageRank сторінки A, PR(A), дорівнює:
При цьому, значення PageRank — це випадкові величини сума яких для всіх сторінок дорівнюватиме 1.
Випадкові подорожі
Для обчислення PageRank Веб представляється у вигляді орієнтованого графу, вершини якого відповідають сторінкам, а ребра — гіперпосиланням між ними. Нехай до пошукового індексу внесено n сторінок. Тоді для моделювання випадкової подорожі створюється матриця переходів M розміру . Елемент цієї матриці , що знаходиться в рядку i та стовпчику j має значення якщо сторінка з номером j має k вихідних посилань, серед яких є одне на сторінку з номером i. Якщо такого посилання нема, то елемент має значення 0.
Розподіл ймовірностей знаходження випадкового мандрівника може бути описано вектор-стовпчиком, рядок j якого дорівнюватиме ймовірності перебування на сторінці j. Цей вектор відповідатиме найпростішому, ідеалізованому варіанту PageRank.
Припустімо, що мандрівник може розпочати блукання з будь-якої із n індексованих сторінок з однаковою ймовірністю. Тоді значення елементів початкового вектора дорівнюватимуть 1/n. Ймовірність знаходження на будь-якій зі сторінок на наступному кроці його блукання можна визначити обчисленням . Іще через крок — , і так далі. Таким чином, процес випадкового блукання є Марковським, а вектор розподілів v — власним для матриці M.
За умови, якщо:
- граф гіперпосилань зв'язний — тобто, з кожної вершини існує шлях до будь-якої іншої;
- в графі відсутні тупикові вершини — тобто, з кожної вершини є бодай одне вихідне гіперпосилання, то з часом розподіл ймовірностей знаходження мандрівника сягне границі: .
Проте, через те, що граф гіперпосилань реальної мережі Веб не завжди зв'язний та має тупикові вершини, у формулу випадкового блукання доводиться запровадити можливість випадкового «стрибка» на іншу вершину. Таким чином, формула обчислення розподілів знаходження матиме вигляд:
- ,
де:
- β — константа, що зазвичай має значення в проміжку 0.8…0.9;
- e — одиничний вектор (розміром n, всі елементи якого дорівнюють 1);
- n — кількість індексованих сторінок, відповідно — кількість вершин графу;
- βM v — моделює випадок, коли з ймовірністю β мандрівник вирішує обрати вихідне посилання з поточної сторінки;
- (1 − β)e/n — вектор, кожен елемент якого дорівнює (1 − β)/n і який моделює появу мандрівника на будь-якій сторінці з ймовірністю (1 − β).
Уявіть собі ідеального вебсерфера, який переміщається по всесвітній павутині. Нехай серфер відвідує сторінку p, випадкове блукання при цьому знаходиться в стані p. На кожному кроці, вебсерфер або перестрибує на іншу сторінку в мережі, обрану псевдо-випадковим чином, або він слід за посиланням на поточній сторінці, при цьому не повертаючись і не відвідуючи одну і ту ж сторінку двічі. Імовірність випадкового стрибка позначимо як d тоді ймовірність переходу за посиланням буде 1-d. Таким чином, імовірність знаходження користувача на сторінці p можна обчислити за такою формулою: де R (p) — PageRank сторінки, С (p) — число посилань на сторінці, к — число посилаються на p сторінок, d-коефіцієнт загасання (damping factor), зазвичай 0.1.
Якщо масштабувати PageRank таким чином, що де N — число всіх сторінок, для яких проводиться розрахунок PageRank, то R (p) можна розглядати як розподіл ймовірності по всіх сторінках. Для обчислення PageRank складається матриця M розміром NxN, де кожному елементу mij матриці присвоюється значення R0 (p) = 1 / C (p) в тому випадку, якщо з i-ї сторінки є посилання на j-ую, що все залишилися елементи матриці заповнюються нулями. Таким чином, обчислення PageRank зводиться до відшукання власного вектора матриці M що досягається множенням матриці M на вектор Rj на кожному кроці ітерації. Введення коефіцієнта загасання гарантує, що процес сходиться. Підвищуємо значимість сайту Усвідомивши переможну ходу PageRank, не можна не задуматися про його збільшення для своєї сторінки. Інтуїтивно зрозуміло, що чим авторитетніший ресурс, на якому розміщено посилання тим більше вона збільшує PageRank сторінки, на яку посилається. І навпаки, чим більше посилань на сторінці, тим менше буде її внесок у підвищення PageRank вашої сторінки — ще один доказ марності участі в FFA (Free For All — сайти, що містять набір посилань з вільним додаванням). Менш очевидна оптимальна топологія взаємно ссилающихся сторінок. Наприклад, сторінки організовані в «кільце» (коли кожна сторінка посилається на сусіда зліва і справа, остання посилається на першу, а перша на останню) будуть мати один і той же PageRank не залежно від кількості сторінок в кільці (якщо не проводити масштабування по сумі, то PageRank у всіх буде дорівнює 1).
Те ж справедливо для «зірок» або випадку, коли всі посилаються на всіх, і, ймовірно, це твердження справедливо взагалі для всіх симетричних топологій. Набагато більш перспективні з точки зору збільшення PageRank асиметричні топології. Твердження про марність створення «порожніх» (але посилаються один на одного) сайтів у безкоштовних хостерів не настільки очевидно. Наприклад, можна організувати обмін посиланнями на 5 сайтах таким чином, що в одного з них PageRank буде в 15 разів більше, ніж мінімальний не нульовий PageRank. У цьому нескладно переконатися, написавши невелику програмку. Деякі поширені помилки пов'язані з PageRank. Проаналізувавши повідомлення в форумах, присвячених позиціонуванню в пошукових системах, можна виділити цілий ряд тверджень про PageRank, як мінімум спірних, а часто просто невірних.
Тематика поєднаних сторінок
Застосування Page Rank в пошуковиках
Традиційні способи знаходження релевантних сторінок, у разі односкладових запитів не дають задовільних результатів, тому що попопулярних тем (наприклад «реферати», «робота») завжди знайдеться велика кількість сторінок з однаковою релевантністю. Для того, щоб якось впорядкувати такі сторінки, пошуковики вдаються до застосування різних інструментів.
Наприклад, видають першими ті сторінки, які мають велику відвідуваність (Rambler) або які присутні в каталозі (Yandex, ). В Google для цих цілей застосовують, зокрема, PageRank, що дає приголомшливі результати, і за короткий час Google став займати лідируючі позиції не тільки за обсягом бази, але і за якістю пошуку.
В березні 2016 року Google заявила, що усуне останню публічно доступну можливість дізнаватись PageRank сторінок — буде припинена робота модулів для веббраузерів (Toolbar PageRank). Однак, алгоритм PageRank й надалі буде використаний в пошуковій системі для оцінки якості сторінок.
Публічний доступ до оцінок PageRank було піддано критиці, оскільки це начебто сприяло поширенню пошукової оптимізації з її негативними наслідками.
Література
Цей розділ потребує доповнення. (вересень 2015) |
Примітки
- Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman (2014). 5.1 PageRank. (PDF). Архів оригіналу (PDF) за 18 вересня 2015. Процитовано 17 вересня 2015.
- Gabriel Pinski and Francis Narin. . Information Processing & Management. 12 (5): 297—312. doi:10.1016/0306-4573(76)90048-0. Архів оригіналу за 24 вересня 2015. Процитовано 22 вересня 2015.
- Thomas Saaty (1977). . Journal of Mathematical Psychology. 15 (3): 234—281. doi:10.1016/0022-2496(77)90033-5. Архів оригіналу за 24 вересня 2015. Процитовано 22 вересня 2015.
- Raphael Phan Chung Wei (16 травня 2002). (вид. Computimes; 2).
{{}}
: Пропущений або порожній|title=
() - сторінку, Ларрі, . Архів оригіналу за 6 травня 2002. Процитовано 16 лютого 2019.
{{}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title () Стенфордський проект електронної бібліотеки, говорити. 18 серпня 1997 (архів 2002) - 187-сторінкове дослідження з університеті Граца, Австрія, [ 16 січня 2014 у Wayback Machine.] включає в себе також увагу, що людський мозок використовуються при визначенні рангу сторінки в Google
- Brin, S.; Page, L. (1998). (PDF). Computer Networks and ISDN Systems. 30: 107—117. doi:10.1016/S0169-7552(98)00110-X. ISSN 0169-7552. Архів оригіналу (PDF) за 27 вересня 2015. Процитовано 24 вересня 2015.
- . Google.com. Архів оригіналу за 23 червня 2008. Процитовано 27 травня 2011.
- David Vise and Mark Malseed (2005). The Google Story. с. 37. ISBN .
- Lisa M. Krieger (1 December 2005). . San Jose Mercury News, cited by redOrbit. Архів оригіналу за 8 квітня 2009. Процитовано 25 лютого 2009.
- Richard Brandt. . Stanford magazine. Архів оригіналу за 10 березня 2009. Процитовано 25 лютого 2009.
- Page, Lawrence; Brin, Sergey; and (1999). . Архів оригіналу за 27 квітня 2006. Процитовано 22 вересня 2015. опублікованій в технічному звіті 29 січня 1998 у форматі PDF [ 10 березня 2020 у Wayback Machine.]
- Li, Yanhong (6 серпня 2002). Toward a qualitative search engine. Internet Computing, IEEE. IEEE Computer Society. 2 (4): 24—29. doi:10.1109/4236.707687.
- Andy Greenberg (5 жовтня 2009). The Man Who's Beating Google. Forbes. Архів оригіналу за 18 вересня 2012. Процитовано 22 вересня 2015.
- «About RankDex» [ 25 травня 2015 у Wayback Machine.], rankdex.com
- Див особливо Лоуренс Пейдж, патенти США U.S. Patent 6 799 176 (2004) «Метод для озвучування документів у пов'язаної бази даних», U.S. Patent 7 058 628 (2006) «Метод для вузла рейтингу в пов'язаної бази даних», і U.S. Patent 7 269 587 (2007) «Залікові документи у зв'язаному базі даних» +2011
- (Mining of Massive Datasets, стор. 167)
- (Mining of Massive Datasets, стор. 174)
- . Архів оригіналу за 2 грудня 2013. Процитовано 2 грудня 2013.
{{}}
: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title () - Barry Schwartz (8 березня 2016). . Search Engine Land. Архів оригіналу за 10 березня 2016. Процитовано 10 березня 2016.
- Danny Sullivan (9 березня 2016). . Search Engine Land. Архів оригіналу за 10 березня 2016. Процитовано 10 березня 2016.
Див. також
Вікіпедія, Українська, Україна, книга, книги, бібліотека, стаття, читати, завантажити, безкоштовно, безкоштовно завантажити, mp3, відео, mp4, 3gp, jpg, jpeg, gif, png, малюнок, музика, пісня, фільм, книга, гра, ігри, мобільний, телефон, android, ios, apple, мобільний телефон, samsung, iphone, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, ПК, web, Інтернет
PageRank simejstvo algoritmiv ocinki vazhlivosti vebstorinok za dopomogoyu rozv yazannya sistem linijnih rivnyan Dlya kozhnoyi storinki obchislyuye dijsne chislo chim bilshe chislo tim vazhlivisha storinka Princip roboti dlya nevelikoyi merezhi Zamist pryamogo pidrahunku kilkosti posilan PageRank interpretuye posilannya storinki A na storinku B yak golos storinki A na korist storinki B Pislya cogo PageRank ocinyuye rejting storinki vidpovidno do kilkosti otrimanih golosiv PageRank takozh vrahovuye znachimist kozhnoyi storinki sho otrimala golos adzhe golosi deyakih storinok ye vazhlivishimi i vidpovidno do cogo pidvishuyetsya znachushist storinki posilannya na yaku voni mistyat Vazhlivi storinki otrimuyut bilsh visoku ocinku PageRank i vidobrazhayutsya na pershih poziciyah rezultativ poshuku Dlya viznachennya znachushosti storinki tehnologiya Google vikoristovuye kolektivnij intelekt vsesvitnoyi merezhi Lyudina ne bere uchasti v obrobci rezultativ Poshukova sistema Google ne spotvoryuye informaciyu pro poziciyi platoyu za rezultati poshuku Najbilshij pejdzhrank sered ukrayinskih resursiv maye Ukrayinska Vikipediya u yakoyi vin dorivnyuye 8 a takozh Ukrayinska pravda ta Gazeta Den po 7 dzherelo Za osnovu PageRank buv obranij akademichnij pidhid ocinki vazhlivosti publikaciyi avtora po chislu yiyi zgadok v bibliografichnih posilannyah inshih avtoriv Dlya adaptaciyi do zastosuvannya v Internet v algoritm buli vneseni nastupni zmini vaga kozhnogo posilannya vrahovuyetsya individualno i normuyetsya za kilkistyu posilan na storinci Krim togo PageRank mozhe buti interpretovano v terminah vipadkovogo blukannya IstoriyaIdeya rozv yazannya problemi analizu zv yaznih danih shlyahom obchislennya vlasnogo vektora bula zaproponovana v 1976 roci Gabrielem Pinski ta Frensis Narina yaki pracyuvali nad skladannyam naukometrichnih rejtingiv naukovih zhurnaliv ta v 1977 roci Tomasom Saati v jogo koncepciyi metodu analizu iyerarhij yakij zvazhuvav alternativni varianti PageRank buv stvorenij v Stenfordskomu universiteti Larri Pejdzhem i Sergiyem Brinom v 1996 roci v ramkah naukovo doslidnogo proektu pro novij vid informacijno poshukovoyi sistemi Sergij Brin visloviv ideyu sho informaciyu v Interneti mozhna vporyadkuvati v iyerarhiyu za populyarnistyu posilan chim bilshe posilan na storinku tim vishij u neyi rang U stvorennya novogo algoritmu takozh zrobili vnesok i Terri Vinograd Persha stattya v yakij opisano PageRank i pochatkovij prototip informacijno poshukovoyi sistemi Google bula nadrukovana v 1998 roci Trohi zgodom Pejdzh i Brin zasnuvali Google Inc kompaniyu sho stoyit za informacijno poshukovoyu sistemoyu Google Hocha PageRank ye lishe odnim z chinnikiv sho vplivayut na rezultati poshuku cej algoritm dosi zabezpechuye osnovu dlya vsih instrumentiv vebposhuku kompaniyi Google Nazva PageRank poyednala prizvishe odnogo z vinahidnikiv Larri Pejdzha angl Page a takozh koncepciyu vebstorinki PageRank zareyestrovana torgovelna marka kompaniyi Google a algoritm bulo zapatentovano U S Patent 6 285 999 Odnak cej patent nalezhit Stenfordskomu universitetu a ne kompaniyi Google Google maye eksklyuzivni prava na licenzijne vikoristannya patentu Stenfordskogo universitetu Natomist universitet otrimav 1 8 mln akcij Google za dozvil vikoristannya patentu akciyi buli prodani v 2005 roci za 336 mln PageRank buv stvorenij pid vplivom algoritmu analizu citovanosti robotu nad yakim rozpochav u 1950 ti v universiteti Pensilvaniyi ta rozroblenij v universiteti Paduyi Togo zh roku koli buv oprilyudnenij algoritm PageRank 1998 opublikuvav svoyu robotu pro algoritm HITS Zasnovniki kompaniyi Google posilayutsya na roboti Garfilda Marhiori ta Klejnberga u vlasnih publikaciyah Porivnyano nevelika informacijno poshukova sistema rozrobki Robina Li sho nalezhala kompaniyi IDD Information Services vzhe v 1996 roci vikoristovuvala shozhij algoritm dlya ranzhuvannya sajtiv ta storinok Vikoristanij v RankDex algoritm buv zapatentovanij v 1999 roci U S Patent 5 920 859 i zgodom buv vikoristanij u zasnovanij v Kitayi Li poshukovij sistemi Baidu Larri Pejdzh posilavsya na robotu Li v deyakih patentah v SShA Obchislennya PageRankOglyad Osnovnoyu metoyu novogo algoritmu bulo polipshiti yakist vidpovidej na poshukovi zapiti Poshukovi sistemi togo chasu znachnoyu miroyu pokladalis na indeksuvannya storinok za klyuchovimi slovami Cim skoristalis zlovmisniki dlya manipulyaciyi rezultatami poshuku metodom poshukovogo spamu Rozrobniki PageRank zaznachili sho stanom na listopad 1997 roku lishe odna iz najposhirenishih poshukovih sistem bula zdatna vkazati vlasnu storinku v pershih 10 rezultatah pri zapiti na vlasnu nazvu bula zdatna znajti sama sebe Zaproponovanij algoritm natomist brav do uvagi strukturu i tekst giperposilan Pri comu Algoritm PageRank modelyuvav vipadkovu podorozh koristuvacha internet pochinayuchi z vipadkovoyi storinki Chim bilshe vipadkovih vidviduvachiv distavalis storinki tim vishe yiyi rejting Rozrobniki pripustili sho v takij sposib vdastsya uniknuti problem zi spamom za klyuchovimi slovami Vmist storinki ocinyuvali ne lishe za klyuchovimi slovami v nij a j v storinkah sho na neyi posilayutsya Rozrobniki pripustili sho zlovmisnikovi bude vazhche spotvoriti vmist storinok sho posilayutsya na jogo storinku tilki yaksho vin ne kontrolyuye inshi storinki Znachennya PageRank dlya storinki A obchislyuyetsya za takimi pravilami nehaj T 1 T n displaystyle T 1 dots T n storinki sho posilayutsya cituyut storinku A Algoritm takozh vikoristovuye koeficiyent dempingu d znachennyam yakogo znahodyatsya v promizhku mizh 0 ta 1 ta zazvichaj maye znachennya 0 85 Funkciya C T dorivnyuye kilkosti posilan sho vihodyat zi storinki T Todi znachennya PageRank storinki A PR A dorivnyuye P R A 1 d d i 1 n P R T i C T i displaystyle PR A 1 d d sum i 1 n frac PR T i C T i Pri comu znachennya PageRank ce vipadkovi velichini suma yakih dlya vsih storinok dorivnyuvatime 1 Vipadkovi podorozhi Dlya obchislennya PageRank Veb predstavlyayetsya u viglyadi oriyentovanogo grafu vershini yakogo vidpovidayut storinkam a rebra giperposilannyam mizh nimi Nehaj do poshukovogo indeksu vneseno n storinok Todi dlya modelyuvannya vipadkovoyi podorozhi stvoryuyetsya matricya perehodiv M rozmiru n n displaystyle n times n Element ciyeyi matrici m i j displaystyle m ij sho znahoditsya v ryadku i ta stovpchiku j maye znachennya 1 k displaystyle 1 k yaksho storinka z nomerom j maye k vihidnih posilan sered yakih ye odne na storinku z nomerom i Yaksho takogo posilannya nema to element maye znachennya 0 Rozpodil jmovirnostej znahodzhennya vipadkovogo mandrivnika mozhe buti opisano vektor stovpchikom ryadok j yakogo dorivnyuvatime jmovirnosti perebuvannya na storinci j Cej vektor vidpovidatime najprostishomu idealizovanomu variantu PageRank Pripustimo sho mandrivnik mozhe rozpochati blukannya z bud yakoyi iz n indeksovanih storinok z odnakovoyu jmovirnistyu Todi znachennya elementiv pochatkovogo vektora dorivnyuvatimut 1 n Jmovirnist znahodzhennya na bud yakij zi storinok na nastupnomu kroci jogo blukannya mozhna viznachiti obchislennyam M v 0 displaystyle M mathbf v 0 Ishe cherez krok M M v 0 M 2 v 0 displaystyle M M mathbf v 0 M 2 mathbf v 0 i tak dali Takim chinom proces vipadkovogo blukannya ye Markovskim a vektor rozpodiliv v vlasnim dlya matrici M Za umovi yaksho graf giperposilan zv yaznij tobto z kozhnoyi vershini isnuye shlyah do bud yakoyi inshoyi v grafi vidsutni tupikovi vershini tobto z kozhnoyi vershini ye bodaj odne vihidne giperposilannya to z chasom rozpodil jmovirnostej znahodzhennya mandrivnika syagne granici v M v displaystyle mathbf v M mathbf v Prote cherez te sho graf giperposilan realnoyi merezhi Veb ne zavzhdi zv yaznij ta maye tupikovi vershini u formulu vipadkovogo blukannya dovoditsya zaprovaditi mozhlivist vipadkovogo stribka na inshu vershinu Takim chinom formula obchislennya rozpodiliv znahodzhennya v displaystyle mathbf v matime viglyad v b M v 1 b e n displaystyle mathbf v beta M mathbf v 1 beta mathbf e n de b konstanta sho zazvichaj maye znachennya v promizhku 0 8 0 9 e odinichnij vektor rozmirom n vsi elementi yakogo dorivnyuyut 1 n kilkist indeksovanih storinok vidpovidno kilkist vershin grafu bM v modelyuye vipadok koli z jmovirnistyu b mandrivnik virishuye obrati vihidne posilannya z potochnoyi storinki 1 b e n vektor kozhen element yakogo dorivnyuye 1 b n i yakij modelyuye poyavu mandrivnika na bud yakij storinci z jmovirnistyu 1 b Uyavit sobi idealnogo vebserfera yakij peremishayetsya po vsesvitnij pavutini Nehaj serfer vidviduye storinku p vipadkove blukannya pri comu znahoditsya v stani p Na kozhnomu kroci vebserfer abo perestribuye na inshu storinku v merezhi obranu psevdo vipadkovim chinom abo vin slid za posilannyam na potochnij storinci pri comu ne povertayuchis i ne vidviduyuchi odnu i tu zh storinku dvichi Imovirnist vipadkovogo stribka poznachimo yak d todi jmovirnist perehodu za posilannyam bude 1 d Takim chinom imovirnist znahodzhennya koristuvacha na storinci p mozhna obchisliti za takoyu formuloyu de R p PageRank storinki S p chislo posilan na storinci k chislo posilayutsya na p storinok d koeficiyent zagasannya damping factor zazvichaj 0 1 Yaksho masshtabuvati PageRank takim chinom sho de N chislo vsih storinok dlya yakih provoditsya rozrahunok PageRank to R p mozhna rozglyadati yak rozpodil jmovirnosti po vsih storinkah Dlya obchislennya PageRank skladayetsya matricya M rozmirom NxN de kozhnomu elementu mij matrici prisvoyuyetsya znachennya R0 p 1 C p v tomu vipadku yaksho z i yi storinki ye posilannya na j uyu sho vse zalishilisya elementi matrici zapovnyuyutsya nulyami Takim chinom obchislennya PageRank zvoditsya do vidshukannya vlasnogo vektora matrici M sho dosyagayetsya mnozhennyam matrici M na vektor Rj na kozhnomu kroci iteraciyi Vvedennya koeficiyenta zagasannya garantuye sho proces shoditsya Pidvishuyemo znachimist sajtu Usvidomivshi peremozhnu hodu PageRank ne mozhna ne zadumatisya pro jogo zbilshennya dlya svoyeyi storinki Intuyitivno zrozumilo sho chim avtoritetnishij resurs na yakomu rozmisheno posilannya tim bilshe vona zbilshuye PageRank storinki na yaku posilayetsya I navpaki chim bilshe posilan na storinci tim menshe bude yiyi vnesok u pidvishennya PageRank vashoyi storinki she odin dokaz marnosti uchasti v FFA Free For All sajti sho mistyat nabir posilan z vilnim dodavannyam Mensh ochevidna optimalna topologiya vzayemno ssilayushihsya storinok Napriklad storinki organizovani v kilce koli kozhna storinka posilayetsya na susida zliva i sprava ostannya posilayetsya na pershu a persha na ostannyu budut mati odin i toj zhe PageRank ne zalezhno vid kilkosti storinok v kilci yaksho ne provoditi masshtabuvannya po sumi to PageRank u vsih bude dorivnyuye 1 Te zh spravedlivo dlya zirok abo vipadku koli vsi posilayutsya na vsih i jmovirno ce tverdzhennya spravedlivo vzagali dlya vsih simetrichnih topologij Nabagato bilsh perspektivni z tochki zoru zbilshennya PageRank asimetrichni topologiyi Tverdzhennya pro marnist stvorennya porozhnih ale posilayutsya odin na odnogo sajtiv u bezkoshtovnih hosteriv ne nastilki ochevidno Napriklad mozhna organizuvati obmin posilannyami na 5 sajtah takim chinom sho v odnogo z nih PageRank bude v 15 raziv bilshe nizh minimalnij ne nulovij PageRank U comu neskladno perekonatisya napisavshi neveliku programku Deyaki poshireni pomilki pov yazani z PageRank Proanalizuvavshi povidomlennya v forumah prisvyachenih pozicionuvannyu v poshukovih sistemah mozhna vidiliti cilij ryad tverdzhen pro PageRank yak minimum spirnih a chasto prosto nevirnih Tematika poyednanih storinokZastosuvannya Page Rank v poshukovikahTradicijni sposobi znahodzhennya relevantnih storinok u razi odnoskladovih zapitiv ne dayut zadovilnih rezultativ tomu sho popopulyarnih tem napriklad referati robota zavzhdi znajdetsya velika kilkist storinok z odnakovoyu relevantnistyu Dlya togo shob yakos vporyadkuvati taki storinki poshukoviki vdayutsya do zastosuvannya riznih instrumentiv Napriklad vidayut pershimi ti storinki yaki mayut veliku vidviduvanist Rambler abo yaki prisutni v katalozi Yandex V Google dlya cih cilej zastosovuyut zokrema PageRank sho daye prigolomshlivi rezultati i za korotkij chas Google stav zajmati lidiruyuchi poziciyi ne tilki za obsyagom bazi ale i za yakistyu poshuku V berezni 2016 roku Google zayavila sho usune ostannyu publichno dostupnu mozhlivist diznavatis PageRank storinok bude pripinena robota moduliv dlya vebbrauzeriv Toolbar PageRank Odnak algoritm PageRank j nadali bude vikoristanij v poshukovij sistemi dlya ocinki yakosti storinok Publichnij dostup do ocinok PageRank bulo piddano kritici oskilki ce nachebto spriyalo poshirennyu poshukovoyi optimizaciyi z yiyi negativnimi naslidkami LiteraturaCej rozdil potrebuye dopovnennya veresen 2015 PrimitkiJure Leskovec Anand Rajaraman Jeffrey D Ullman 2014 5 1 PageRank PDF Arhiv originalu PDF za 18 veresnya 2015 Procitovano 17 veresnya 2015 Gabriel Pinski and Francis Narin Information Processing amp Management 12 5 297 312 doi 10 1016 0306 4573 76 90048 0 Arhiv originalu za 24 veresnya 2015 Procitovano 22 veresnya 2015 Thomas Saaty 1977 Journal of Mathematical Psychology 15 3 234 281 doi 10 1016 0022 2496 77 90033 5 Arhiv originalu za 24 veresnya 2015 Procitovano 22 veresnya 2015 Raphael Phan Chung Wei 16 travnya 2002 vid Computimes 2 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite news title Shablon Cite news cite news a Propushenij abo porozhnij title dovidka storinku Larri Arhiv originalu za 6 travnya 2002 Procitovano 16 lyutogo 2019 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite web title Shablon Cite web cite web a Obslugovuvannya CS1 Storinki z tekstom archived copy yak znachennya parametru title posilannya Stenfordskij proekt elektronnoyi biblioteki govoriti 18 serpnya 1997 arhiv 2002 187 storinkove doslidzhennya z universiteti Graca Avstriya 16 sichnya 2014 u Wayback Machine vklyuchaye v sebe takozh uvagu sho lyudskij mozok vikoristovuyutsya pri viznachenni rangu storinki v Google Brin S Page L 1998 PDF Computer Networks and ISDN Systems 30 107 117 doi 10 1016 S0169 7552 98 00110 X ISSN 0169 7552 Arhiv originalu PDF za 27 veresnya 2015 Procitovano 24 veresnya 2015 Google com Arhiv originalu za 23 chervnya 2008 Procitovano 27 travnya 2011 David Vise and Mark Malseed 2005 The Google Story s 37 ISBN 0 553 80457 X Lisa M Krieger 1 December 2005 San Jose Mercury News cited by redOrbit Arhiv originalu za 8 kvitnya 2009 Procitovano 25 lyutogo 2009 Richard Brandt Stanford magazine Arhiv originalu za 10 bereznya 2009 Procitovano 25 lyutogo 2009 Page Lawrence Brin Sergey and 1999 Arhiv originalu za 27 kvitnya 2006 Procitovano 22 veresnya 2015 opublikovanij v tehnichnomu zviti 29 sichnya 1998 u formati PDF 10 bereznya 2020 u Wayback Machine Li Yanhong 6 serpnya 2002 Toward a qualitative search engine Internet Computing IEEE IEEE Computer Society 2 4 24 29 doi 10 1109 4236 707687 Andy Greenberg 5 zhovtnya 2009 The Man Who s Beating Google Forbes Arhiv originalu za 18 veresnya 2012 Procitovano 22 veresnya 2015 About RankDex 25 travnya 2015 u Wayback Machine rankdex com Div osoblivo Lourens Pejdzh patenti SShA U S Patent 6 799 176 2004 Metod dlya ozvuchuvannya dokumentiv u pov yazanoyi bazi danih U S Patent 7 058 628 2006 Metod dlya vuzla rejtingu v pov yazanoyi bazi danih i U S Patent 7 269 587 2007 Zalikovi dokumenti u zv yazanomu bazi danih 2011 Mining of Massive Datasets stor 167 Mining of Massive Datasets stor 174 Arhiv originalu za 2 grudnya 2013 Procitovano 2 grudnya 2013 a href wiki D0 A8 D0 B0 D0 B1 D0 BB D0 BE D0 BD Cite web title Shablon Cite web cite web a Obslugovuvannya CS1 Storinki z tekstom archived copy yak znachennya parametru title posilannya Barry Schwartz 8 bereznya 2016 Search Engine Land Arhiv originalu za 10 bereznya 2016 Procitovano 10 bereznya 2016 Danny Sullivan 9 bereznya 2016 Search Engine Land Arhiv originalu za 10 bereznya 2016 Procitovano 10 bereznya 2016 Div takozhIndeks cituvan Optimizaciya dlya poshukovih sistem Markovskij proces