Группа ученых из США, Израиля и Швеции разработала новый метод определения влиятельности пользователей социальных сетей и блогеров. Лента.Ру для начала разобралась в его деталях, а потом попробовала себе представить, как выглядел бы рейтинг российской блогосферы, составленный при помощи этого метода. Обнаружилось много занятного.
Группа ученых из США, Израиля и Швеции разработала новый метод определения влиятельности пользователей социальных сетей и блогеров. Лента.Ру для начала разобралась в его деталях, а потом попробовала себе представить, как выглядел бы рейтинг российской блогосферы, составленный при помощи этого метода. Обнаружилось много занятного.
Матчасть
Главным инструментом при изучении сетей самых различных видов является теория графов. Формально граф определяется как пара множеств V (вершин) и E (ребер), в которых каждому ребру из E поставлена в соответствие пара вершин из V. Данный объект можно представить себе просто как схему на листе бумаги, состоящую из точек, некоторые из которых соединены линиями.
При помощи графов ученые моделировали социальные сети. В данном случае вершины графа (точки) - это пользователи, а ребра (линии) - информационная взаимосвязь между пользователями. В каждом конкретном случае природа этих связей была различна: например, в ЖЖ, который послужил одним из объектов изучения, ребра соединяли "френдов". Или вот в сети, составленной из актеров кино категории "для взрослых", ребра соединяли актеров, которым довелось играть в одном фильме. Разумеется, подобные схемы были слишком громоздки для непосредственного рисования (только для ЖЖ в распоряжении ученых были данные о 5,5 миллиона пользователей), поэтому все работы проводились на компьютере.
Одной из целей исследования была классификация пользователей по их влиянию на распространение информации. Однако как это сделать? Первое, что приходит в голову - пользователь тем влиятельнее, чем больше у него друзей. Однако это убеждение неверно.
Пусть, например, есть некто мистер Икс, у которого много друзей-изгоев, то есть таких пользователей, которые настолько скучны, что дружат только с мистером Икс. Пусть последний решил распространить некую информацию: запостил нечто у себя в блоге и просит своих "френдов" ему помочь. Они, конечно, перепостят эту запись по просьбе единственного друга, однако дальше эта информация не пойдет, так как у изгоев нет возможности продвигать информацию дальше. Из этого примера хорошо видно, что для эффективного распространения последней пользователь должен быть, в некотором смысле, в центре сети. Однако что значит в центре, если изображение у нас абсолютно схематическое?
На первый взгляд кажется, что наиболее влиятельны в этой сети пользователи 6 и 8. Однако на самом деле таких четверо: 5, 6, 7 и 8.
В рамках работы ученые нашли ответ. Каждому пользователю они присвоили целочисленный индекс: чем он выше, тем пользователь влиятельнее. Считать этот индекс предлагается при помощи так называемых k-оболочек. Алгоритм их построения опишем на примере приведенного рисунка. Сначала из схемы выкинем всех пользователей, у кого не более одного друга (то есть либо ноль, либо один). В нашей схеме такой пользователь ровно один - это пользователь номер 1. При этом в нашей схеме появился еще один пользователь, у которого ровно один друг - это пользователь номер 2. Продолжим выкидывать точки до тех пор, пока в нашей схеме не останется ни одной вершины с одним ребром. Все удаленные точки (в нашем случае это номера 1, 2 и 3) представляют собой 1-оболочку и получают индекс 1. Теперь повторим этот процесс уже для пользователей, у которых как минимум два друга (в нашем случае это вершина с номером 4). Выкинутые точки получат индекс два. И так далее.
Отбросив все вершины графа с индексом 2, мы получим четыре вершины, у каждой из которых будет по три ребра: номера 5, 6, 7 и 8. Их влияние будет равным (индекс 3), хотя изначально у номеров 6 и 8 было больше ребер (по четыре).
Таким образом, наш мистер Икс, хоть и имеет много "френдов", все равно имеет индекс влиятельности 1 и при применении описанного алгоритма будет выкинут довольно быстро. То есть количество "френдов" и индекс влиятельности - это совсем не одно и то же, и они даже не прямо пропорциональны.
Это, конечно, сильно упрощенная схема: она предусматривает только один тип информационной взаимосвязи между пользователями. Тогда как в том же ЖЖ типов как минимум три: "друг" (Friend), "в друзьях у" (Friend Of) и "взаимный друг" (Mutual Friend). Чтобы учитывать это, наш граф должен стать раскрашенным (с ребрами разных цветов в зависимости от типа взаимосвязи). Кроме того, многие пользователи, у кого "френдов" много, часто распределяют их по группам, и группы эти получают неодинаковое внимание, что тоже влияет на распространение информации.
Однако понятно, что речь идет лишь о методе. Все многообразие информационных взаимодействий в блогосфере формализовать и впихнуть в алгоритм, конечно, не получится, но новый рейтинг топ-блогеров при помощи этого метода составить вполне возможно.
Воплощение
Теперь попробуем представить себе рейтинг блогов (не постов!!! речь не идет о новом топе на смену почившему топу "Яндекса"!) Рунета, составленный на основе этого метода. Главное его достоинство будет заключаться в том, что на него не окажут никакого влияния разного рода виртуалы и боты, при помощи которых предпочитают накручивать показатели авторитетности разного рода вебдванольные пиарщики. Поскольку живые люди виртуалов и ботов, как правило, не "френдят", они будут отсекаться на ранних этапах применения алгоритма.
При специфическом устройстве нашей блогосферы верхние строчки, скорее всего, оккупирует довольно замкнутая группа "многотысячников", которые дружат между собой. Причем у Антона Носика aka dolboeb появятся все шансы обогнать по влиятельности непримиримых соперников Артемия Лебедева aka tema и Рустема Адагамова aka drugoi: Тема и Другой, имея по много тысяч "френдов", между собой не дружат, а Носик, тоже имея много тысяч "френдов", дружит с обоими. То есть расположен в графе стратегически более выгодно.
В гипотетическом новом рейтинге едва ли будет иметь столь высокую позицию, как в рейтинге "Яндекса", ЖЖ uborshizzza: всякие тестики и пазлики интересны скучающим офисным работникам, студенткам на каникулах и домохозяйкам, а влиятельным блогерам - нет. Вообще, больше шансов на лидерство в новом рейтинге будет у блогов с серьезным, а не развлекательным контентом. Влиятельность и популярность в нем будут разведены довольно резко.
Алгоритм, на основе которого будет формироваться гипотетический рейтинг, довольно сложен и требует гигантского объема расчетов. Обновляться рейтинг будет довольно редко, так что отслеживать по нему изменения влиятельности блогеров в ежедневном режиме едва ли получится. Впрочем, первая десятка (или даже двадцатка) рейтинга, скорее всего, будет весьма устойчива.
Согласитесь, рейтинг бы получился весьма занимательный. Вот бы взялся кто-нибудь его составить...
Мне жаль, что наше общество достигло такого уровня невежества, что подобные, с позволения сказать, «открытия» печатаются как нечто новое и заслуживающее внимания. Ничего нового в изложенных идеях нет. Нет и ничего такого, что могло бы носить гордую характеристику «вопреки интуиции».
Любой человек интуитивно понимает, что влиять на влиятельных людей, лучше, чем влиять на людей, которые ничего не решают. Но только в том случае, если влиятельные люди, после вашего влияния, влияют на большее количество людей, чем то количество, на которое можно повлиять напрямую. Законы эти хорошо известны в социологии, политике и менеджменте. Даже пресловутая поговорка «кадры решают всё» — не что иное, как эта идея — смысл её можно раскрыть и так: «если вы руководите лучшими специалистами (более влиятельными), вы сможете с большей вероятностью достичь успеха (повлиять на процессы эффективней). Можно приводить бесчисленное количество примеров интерпретации этой старинной истины, для этого достаточно просто подумать.
Описание теории графов и фразы типа «алгоритм довольно сложен и требует гигантского объема расчетов», конечно, придают загадочный антураж статье в глазах большинства читателей. Но алгоритм простецкий, а гигантский объём расчётов получился из-за большого количества связей в ЖЖ. Но кому это надо? Убедиться что один патологический матершиник влиятельней, чем другой? Почему собственно ЖЖ и фильмы для взрослых? Для пиара? Математика вообще-то всегда довольствовалась идеальными моделями. Складывается впечатление, что кто-то усиленно пытается оправдать деньги, выделенные на гранд.
О, вы, как я погляжу, специалист по распиливанию грантов будете. Прекрасно.
Итак, во-первых, я таких наук как социолоия, политика, менеджмент (чур меня!) не знаю. Вот биологию знаю, химию, математику, а те, про которые вы говорите - не. Что касается "это давно известно", то возможно. Однако в данном случае ценность представляет именно численное выражение влиятельности, индекс. Поэтому эта работа заслуживает внимания.
Пойдем дальше. Теория графов здесь используется потому, что в отличие таких дисциплин как политика и менеджмент, в прикладной математике принято выполнять работы на достаточно высоком уровне строгости, потому что цитата "кадры решаю все" крута, но для практической оценки малопригодна.
Что касается вашего замечания про смысл и прочее, то оно выдает в вас читателя невнимательного. Если бы вы действительно хотели бы разобраться, на расстоянии двух кликов от статьи вы бы обнаружили препринт работы, из которого достаточно быстро бы узнали, что
1) Массивов данных для анализа было значительно больше. Приведенные здесь примеры (а в комментарии нигде не говорится что это были едиснвенные примеры) были выбраны просто потому, что они интересные. У ученых для выбора этих двух были свои мотивы. Так как исследование социальных сетей - наука во многом пока эмпирическая, то "сеть актеров" - замечательный пример сети, образовавшейся за достаточно короктий промежуток времени. В свою очередь ЖЖ - один из крупнейших массивов данных, который был в распоряжении исследователей.
2) Суть работы заключалась в исследовании топологических свойств реально существующих социальных сетей имоделированию распространения вирусов в них по различным схемам. В отличие от исходной работы статья на Ленте посвящена возможным последствиям применения подобного алгоритма в ЖЖ, то есть, учитывая влияние этого института на политическую жизнь в нашей стране, вопрос совершенно не праздный.
Вы, дружище, не берите близко к сердцу. Когда я полностью прочёл ваш развёрнутый ответ, я решил опустить реакцию на переходы на личности о «распиливании грантов» и ликбез об определении социологии, потому как ясно мне стало, что произошло в действительности. Позволю себе изложить я эту догадку. Учёные тихо себе изучали такие важные вещи как распространение вирусов, используя теорию графов, открыли «вопреки интуиции» «велосипед», ценность открытия, которого в численном и измеримом представлении гораздо выше, чем очевидное, вроде фразы «кадры решают всё». Но на то она и наука, чтобы усомняться в очевидном и доказывать это надёжными методами. Вы же решили, как полагаю я, привлечь внимание людей к этому открытию, добавив туда несколько интересных, по вашему мнению, фактов, таких как примеры жежеистов рунета, а так же заострили внимание в статье на таких не скучных вещах, как социальные сети и фильмы для взрослых. И потому смешалось всё в статье и факты и предположения, и сложно стало отделить зёрна от плевел. Между тем не виню я вас, поскольку добавлять интересности — всегда благородная задача любого издания, вдвойне благородно это дело на путях науки и просвещения. Осторожным только нужно быть, ибо можно оказаться непонятым.
Есть такая прикольная наука - социометрия, ее изобретатель Якоб Леви Морено все уже давно придумал и описал в своих трудах - остается только интерпретировать его работу в новом свете - интернет сообщества не малые группы, но всеже. И видимо пока не нашлось толковых специалистов с нужным набором исходных данных в руках...=)
На сколько я понял, по сути, этот алгоритм - некая реинкарнация яшиного ТИЦ или гуглова PageRank. То есть, подхода, когда для определения веса блога учитывается не только количество его связей, но и собственный вес тех блогов, с которыми он связан. Так что лишь очередное изобретение велосипеда.
k-оболочки применялись ранее, да и сама работа была посвящена немного другим вещам (см. пост выше). В статье на Ленте, однако, просто рассматриваются возможные последствия примения подобного алгоритма к сети ЖЖ. Дело в том, что написанный алгоритм - это скорее пояснение на пальцах определения оболочки, которое, вообще говоря, звучит так.
Рассмотрим подграф Hk исходного графа G. обладающий свойствами: степень всякой вершины в смысле подграфа не меньше k и Hk - максимальный, обладающий подобным свойством подграф. Из свойств вытекает, что, если для некоторого k данный подграф существует, то он единственный (это замечание необходимо для корректности определения). Таким образом, множество вершин Hk минус множество вершин H(k+1) и будет k-оболочкой.
Только я бы только не стал сранивать PageRank с приведенным выше индексом. Во-первых, там граф ориентируемый. Во-вторых, мне кажется, что описанный выше мистер Икс может иметь достаточно большой ранг потому, что на него будет вести много ссылок от изгоев. В свою очередь, если остальной сегмент сети меньше, то мне кажется легко построить пример, когда индек Икса будетт оставаться единичкой, а PageRank будет выдавать на нем достаточно высокое значение.
Они украли у меня мои идеи! Я почему-то знал это, основываясь исключительно на простой логике! Автор, извини конечно, но на западе есть привычка проводить популярные исследования для профита. Писать статью, посвящённую таким исследованиям, ну, не очень правильно.
Прежде чем писать свои мнения/замечания, советую просматривать комментарии других читателей - быть может у кого-то из них уже возникали похожие замечания/сомнения и прочее. Начать советую с ПЕРВОГО комментария к даннос статье.
Вопреки интуиции
Группа ученых из США, Израиля и Швеции разработала новый метод определения влиятельности пользователей социальных сетей и блогеров. Лента.Ру для начала разобралась в его деталях, а потом попробовала себе представить, как выглядел бы рейтинг российской блогосферы, составленный при помощи этого метода. Обнаружилось много занятного.
Группа ученых из США, Израиля и Швеции разработала новый метод определения влиятельности пользователей социальных сетей и блогеров. Лента.Ру для начала разобралась в его деталях, а потом попробовала себе представить, как выглядел бы рейтинг российской блогосферы, составленный при помощи этого метода. Обнаружилось много занятного.
Матчасть
Главным инструментом при изучении сетей самых различных видов является теория графов. Формально граф определяется как пара множеств V (вершин) и E (ребер), в которых каждому ребру из E поставлена в соответствие пара вершин из V. Данный объект можно представить себе просто как схему на листе бумаги, состоящую из точек, некоторые из которых соединены линиями.
При помощи графов ученые моделировали социальные сети. В данном случае вершины графа (точки) - это пользователи, а ребра (линии) - информационная взаимосвязь между пользователями. В каждом конкретном случае природа этих связей была различна: например, в ЖЖ, который послужил одним из объектов изучения, ребра соединяли "френдов". Или вот в сети, составленной из актеров кино категории "для взрослых", ребра соединяли актеров, которым довелось играть в одном фильме. Разумеется, подобные схемы были слишком громоздки для непосредственного рисования (только для ЖЖ в распоряжении ученых были данные о 5,5 миллиона пользователей), поэтому все работы проводились на компьютере.
Одной из целей исследования была классификация пользователей по их влиянию на распространение информации. Однако как это сделать? Первое, что приходит в голову - пользователь тем влиятельнее, чем больше у него друзей. Однако это убеждение неверно.
Пусть, например, есть некто мистер Икс, у которого много друзей-изгоев, то есть таких пользователей, которые настолько скучны, что дружат только с мистером Икс. Пусть последний решил распространить некую информацию: запостил нечто у себя в блоге и просит своих "френдов" ему помочь. Они, конечно, перепостят эту запись по просьбе единственного друга, однако дальше эта информация не пойдет, так как у изгоев нет возможности продвигать информацию дальше. Из этого примера хорошо видно, что для эффективного распространения последней пользователь должен быть, в некотором смысле, в центре сети. Однако что значит в центре, если изображение у нас абсолютно схематическое?
Отбросив все вершины графа с индексом 2, мы получим четыре вершины, у каждой из которых будет по три ребра: номера 5, 6, 7 и 8. Их влияние будет равным (индекс 3), хотя изначально у номеров 6 и 8 было больше ребер (по четыре).
Таким образом, наш мистер Икс, хоть и имеет много "френдов", все равно имеет индекс влиятельности 1 и при применении описанного алгоритма будет выкинут довольно быстро. То есть количество "френдов" и индекс влиятельности - это совсем не одно и то же, и они даже не прямо пропорциональны.
Это, конечно, сильно упрощенная схема: она предусматривает только один тип информационной взаимосвязи между пользователями. Тогда как в том же ЖЖ типов как минимум три: "друг" (Friend), "в друзьях у" (Friend Of) и "взаимный друг" (Mutual Friend). Чтобы учитывать это, наш граф должен стать раскрашенным (с ребрами разных цветов в зависимости от типа взаимосвязи). Кроме того, многие пользователи, у кого "френдов" много, часто распределяют их по группам, и группы эти получают неодинаковое внимание, что тоже влияет на распространение информации.
Однако понятно, что речь идет лишь о методе. Все многообразие информационных взаимодействий в блогосфере формализовать и впихнуть в алгоритм, конечно, не получится, но новый рейтинг топ-блогеров при помощи этого метода составить вполне возможно.
Воплощение
Теперь попробуем представить себе рейтинг блогов (не постов!!! речь не идет о новом топе на смену почившему топу "Яндекса"!) Рунета, составленный на основе этого метода. Главное его достоинство будет заключаться в том, что на него не окажут никакого влияния разного рода виртуалы и боты, при помощи которых предпочитают накручивать показатели авторитетности разного рода вебдванольные пиарщики. Поскольку живые люди виртуалов и ботов, как правило, не "френдят", они будут отсекаться на ранних этапах применения алгоритма.
При специфическом устройстве нашей блогосферы верхние строчки, скорее всего, оккупирует довольно замкнутая группа "многотысячников", которые дружат между собой. Причем у Антона Носика aka dolboeb появятся все шансы обогнать по влиятельности непримиримых соперников Артемия Лебедева aka tema и Рустема Адагамова aka drugoi: Тема и Другой, имея по много тысяч "френдов", между собой не дружат, а Носик, тоже имея много тысяч "френдов", дружит с обоими. То есть расположен в графе стратегически более выгодно.
В гипотетическом новом рейтинге едва ли будет иметь столь высокую позицию, как в рейтинге "Яндекса", ЖЖ uborshizzza: всякие тестики и пазлики интересны скучающим офисным работникам, студенткам на каникулах и домохозяйкам, а влиятельным блогерам - нет. Вообще, больше шансов на лидерство в новом рейтинге будет у блогов с серьезным, а не развлекательным контентом. Влиятельность и популярность в нем будут разведены довольно резко.
Алгоритм, на основе которого будет формироваться гипотетический рейтинг, довольно сложен и требует гигантского объема расчетов. Обновляться рейтинг будет довольно редко, так что отслеживать по нему изменения влиятельности блогеров в ежедневном режиме едва ли получится. Впрочем, первая десятка (или даже двадцатка) рейтинга, скорее всего, будет весьма устойчива.
Согласитесь, рейтинг бы получился весьма занимательный. Вот бы взялся кто-нибудь его составить...
Мне жаль, что наше общество достигло такого уровня невежества, что подобные, с позволения сказать, «открытия» печатаются как нечто новое и заслуживающее внимания. Ничего нового в изложенных идеях нет. Нет и ничего такого, что могло бы носить гордую характеристику «вопреки интуиции».
Любой человек интуитивно понимает, что влиять на влиятельных людей, лучше, чем влиять на людей, которые ничего не решают. Но только в том случае, если влиятельные люди, после вашего влияния, влияют на большее количество людей, чем то количество, на которое можно повлиять напрямую. Законы эти хорошо известны в социологии, политике и менеджменте. Даже пресловутая поговорка «кадры решают всё» — не что иное, как эта идея — смысл её можно раскрыть и так: «если вы руководите лучшими специалистами (более влиятельными), вы сможете с большей вероятностью достичь успеха (повлиять на процессы эффективней). Можно приводить бесчисленное количество примеров интерпретации этой старинной истины, для этого достаточно просто подумать.
Описание теории графов и фразы типа «алгоритм довольно сложен и требует гигантского объема расчетов», конечно, придают загадочный антураж статье в глазах большинства читателей. Но алгоритм простецкий, а гигантский объём расчётов получился из-за большого количества связей в ЖЖ. Но кому это надо? Убедиться что один патологический матершиник влиятельней, чем другой? Почему собственно ЖЖ и фильмы для взрослых? Для пиара? Математика вообще-то всегда довольствовалась идеальными моделями. Складывается впечатление, что кто-то усиленно пытается оправдать деньги, выделенные на гранд.
О, вы, как я погляжу, специалист по распиливанию грантов будете. Прекрасно.
Итак, во-первых, я таких наук как социолоия, политика, менеджмент (чур меня!) не знаю. Вот биологию знаю, химию, математику, а те, про которые вы говорите - не. Что касается "это давно известно", то возможно. Однако в данном случае ценность представляет именно численное выражение влиятельности, индекс. Поэтому эта работа заслуживает внимания.
Пойдем дальше. Теория графов здесь используется потому, что в отличие таких дисциплин как политика и менеджмент, в прикладной математике принято выполнять работы на достаточно высоком уровне строгости, потому что цитата "кадры решаю все" крута, но для практической оценки малопригодна.
Что касается вашего замечания про смысл и прочее, то оно выдает в вас читателя невнимательного. Если бы вы действительно хотели бы разобраться, на расстоянии двух кликов от статьи вы бы обнаружили препринт работы, из которого достаточно быстро бы узнали, что
1) Массивов данных для анализа было значительно больше. Приведенные здесь примеры (а в комментарии нигде не говорится что это были едиснвенные примеры) были выбраны просто потому, что они интересные. У ученых для выбора этих двух были свои мотивы. Так как исследование социальных сетей - наука во многом пока эмпирическая, то "сеть актеров" - замечательный пример сети, образовавшейся за достаточно короктий промежуток времени. В свою очередь ЖЖ - один из крупнейших массивов данных, который был в распоряжении исследователей.
2) Суть работы заключалась в исследовании топологических свойств реально существующих социальных сетей имоделированию распространения вирусов в них по различным схемам. В отличие от исходной работы статья на Ленте посвящена возможным последствиям применения подобного алгоритма в ЖЖ, то есть, учитывая влияние этого института на политическую жизнь в нашей стране, вопрос совершенно не праздный.
Вы, дружище, не берите близко к сердцу. Когда я полностью прочёл ваш развёрнутый ответ, я решил опустить реакцию на переходы на личности о «распиливании грантов» и ликбез об определении социологии, потому как ясно мне стало, что произошло в действительности. Позволю себе изложить я эту догадку. Учёные тихо себе изучали такие важные вещи как распространение вирусов, используя теорию графов, открыли «вопреки интуиции» «велосипед», ценность открытия, которого в численном и измеримом представлении гораздо выше, чем очевидное, вроде фразы «кадры решают всё». Но на то она и наука, чтобы усомняться в очевидном и доказывать это надёжными методами. Вы же решили, как полагаю я, привлечь внимание людей к этому открытию, добавив туда несколько интересных, по вашему мнению, фактов, таких как примеры жежеистов рунета, а так же заострили внимание в статье на таких не скучных вещах, как социальные сети и фильмы для взрослых. И потому смешалось всё в статье и факты и предположения, и сложно стало отделить зёрна от плевел. Между тем не виню я вас, поскольку добавлять интересности — всегда благородная задача любого издания, вдвойне благородно это дело на путях науки и просвещения. Осторожным только нужно быть, ибо можно оказаться непонятым.
Здорово, что взаимопонимание нашлось )
Я тут на том же хабре, где т.н. IT-шники сидят, задал этот вопрос и никто не смог ответить :)
http://habrahabr.ru/blogs/social_networks/82991/
Есть такая прикольная наука - социометрия, ее изобретатель Якоб Леви Морено все уже давно придумал и описал в своих трудах - остается только интерпретировать его работу в новом свете - интернет сообщества не малые группы, но всеже. И видимо пока не нашлось толковых специалистов с нужным набором исходных данных в руках...=)
На сколько я понял, по сути, этот алгоритм - некая реинкарнация яшиного ТИЦ или гуглова PageRank.
То есть, подхода, когда для определения веса блога учитывается не только количество его связей, но и собственный вес тех блогов, с которыми он связан. Так что лишь очередное изобретение велосипеда.
k-оболочки применялись ранее, да и сама работа была посвящена немного другим вещам (см. пост выше). В статье на Ленте, однако, просто рассматриваются возможные последствия примения подобного алгоритма к сети ЖЖ. Дело в том, что написанный алгоритм - это скорее пояснение на пальцах определения оболочки, которое, вообще говоря, звучит так.
Рассмотрим подграф Hk исходного графа G. обладающий свойствами: степень всякой вершины в смысле подграфа не меньше k и Hk - максимальный, обладающий подобным свойством подграф. Из свойств вытекает, что, если для некоторого k данный подграф существует, то он единственный (это замечание необходимо для корректности определения). Таким образом, множество вершин Hk минус множество вершин H(k+1) и будет k-оболочкой.
Только я бы только не стал сранивать PageRank с приведенным выше индексом. Во-первых, там граф ориентируемый. Во-вторых, мне кажется, что описанный выше мистер Икс может иметь достаточно большой ранг потому, что на него будет вести много ссылок от изгоев. В свою очередь, если остальной сегмент сети меньше, то мне кажется легко построить пример, когда индек Икса будетт оставаться единичкой, а PageRank будет выдавать на нем достаточно высокое значение.
Они украли у меня мои идеи! Я почему-то знал это, основываясь исключительно на простой логике! Автор, извини конечно, но на западе есть привычка проводить популярные исследования для профита. Писать статью, посвящённую таким исследованиям, ну, не очень правильно.
Прежде чем писать свои мнения/замечания, советую просматривать комментарии других читателей - быть может у кого-то из них уже возникали похожие замечания/сомнения и прочее. Начать советую с ПЕРВОГО комментария к даннос статье.
Мне он ничего не заказывал