Створено рейтинг найвпливовіших університетів світу заснований на аналізі Вікіпедії

Місяць тому з’явився ще один рейтинг університетів світу. На цей раз він створений не аналітичною організацією у сфері якості освіти, а групою науковців на основі статей про найбільш впливові університети світу у 24-х мовних розділах Вікіпедії, найпопулярнішої онлайн-енциклопедії у світі.

Картограма географічного поширення університетів, присутніх у «рейтингу Вікіпедії», які ранжовані за допомогою алгоритма PageRank.
Кольори ранжовані від темно-синього (мала присутність університетів у рейтингу) до темно-червоного (максимальна кількість університетів у рейтингу; тут для США – 118).
Джерело: сайт проекту «Wikipedia Ranking of World Universities».

 

Протягом листопада місяця з’явився сайт проекту «Wikipedia Ranking of World Universities» та публікація на arXiv.org (безкоштовний архів електронних публікацій наукових статей та їх препринтів, що підтримується бібліотекою Корнельського університету) з результатами дослідження Хосе Лагеса з Тулузького університету (Франція) за участі Антуана Патта (Тулузький університет) та Діми Шепелянського (Університет Франш-Конте, Франція) про те, як 3 алгоритми ранжування сторінок (PageRank, 2DRank та CheiRank) було застосовано до кількості згадок про університети світу через внутрішні посилання (їх зв’язність) у 24-х мовних розділах Вікіпедії (англійська, німецька, французька, голландська, італійська, іспанська, російська, польська, японська, шведська, португальська, китайська, в’єтнамська, перська, угорська, корейська, турецька, арабська, малайська, данська, іврит, гінді, грецька, тайська) станом на середину лютого 2013 року.  Йдеться не тільки про статті про університети, а, насамперед, про можливість з них перейти через внутрішні посилання на інші статті про підрозділи та науковців університету або з будь-якої статті на статті про університет, що також враховувалось при складанні «рейтингу Вікіпедії». У Вікіпедії це називається «зв’язністю», тобто можливістю з одної статті перейти на будь-яку іншу, і таким чином дійти до кожної статті, незалежно від кількості таких переходів. А статті, на які та/або з яких такі переходи неможливі називаються «ізольованими», і вікіпедисти докладають багатьох зусиль, аби подібних статей було якомога менше.

До речі, коли у 2012 році в Україні почали запроваджувати «Освітню програму Вікіпедії» (міжнародну програму для студентів та викладачів, що має на меті, якщо сказати дуже просто, замінити паперові реферати на статті в українській Вікіпедії), то вже тоді на зустрічах та презентаціях я, будучи серед групи активістів, які просували і нині просувають цю програму, наголошував, що статті у Вікіпедії про університет та використання в інших статтях Вікіпедії праць університетських викладачів та науковців – це, крім всього, є мірилом цитованості університету в Інтернеті, що є одним зі складових міжнародних рейтингів університетів світу.

Так ось за кожним з 3-х алгоритмів було ранжовано у кожному з 24-х мовних розділів по 100 найпомітніших та найвпливовіших університетів світу, після чого всі відібрані таким чином університети світу були ранжовані у єдиному загальному рейтингу, який і став «рейтингом Вікіпедії». Різниця між самими алгоритмами пояснює чому для кожного з них було відібрано різну кількість університетів (для PageRank – 1025, для 2DRank – 1560, а для CheiRank – 1379) – тобто чим більша кількість відібраних університетів, тим менша кількість потраплянь одного і того самого університету до топ-100 рейтингів у різних мовних розділах Вікіпедії і навпаки.

Варто додати, що методика складання рейтингів на основі аналізу статей Вікіпедії із застосуванням різних алгоритмів ранжування сторінок була апробована групою дослідників, до яких входив і Діма Шепелянський, в рамках проекту NADINE при створенні рейтингів топ-30 важливих культурних діячів у 9-ти мовних розділах Вікіпедії, а також топ-100 історичних постатей у 24-х мовних розділах Вікіпедії, після чого також створювався загальний рейтинг.

Отже, у результаті дослідження було створено рейтинги університетів світу за якістю відображення у цих 24-х мовних розділах Вікіпедії при застосуванні кожного з 3-х алгоритмів. При цьому найбільш релевантним виявився, звісно, алгоритм PageRank (або алгоритм, що використовується у Google), оскільки автори відзначили співпадіння на 62% із Шанхайським рейтингом університетів світу 2013 року (видається з 2003 року та вважається ледь не найавторитетнішим рейтингом університетів світу), що підтверджує достовірність «рейтингу Вікіпедії» та  надійність методів дослідження. Таке стало можливо, зокрема, завдяки і тому, що у Вікіпедії використовується внутрішній алгоритм пошуку сторінок, аналогічний до того, що застосовується у пошуковику Google, який сортує сторінки на засадах взаємопов’язаності, цитованості, а також важливості для людей.

Важливим моментом є те, що під час визначення місця університету в рейтингу враховувались кількість внутрішніх посилань у кожному мовному розділі на статтю про університет, кількість посилань з неї на інші статті у Вікіпедії, а також кількість посилань з інших статей Вікіпедії на ще інші, за винятком статті про університет. Так, виявилось, що найбільш репрезентативний алгоритм PageRank має залежність від кількості внутрішніх посилань зі всіх статей у Вікіпедії на статтю про сам університет («імпорт-залежність»). Насправді, це є ніщо іншим, як залежність від охоплення певної теми загалом, тобто комплексу всіх статей про університет, його діяльність (наукову та культурну), про його значимих науковців, викладачів та випускників (відповідно до правил Вікіпедії) . Йдеться про відомість, пізнаваність та впливовість через осіб та наукову чи культурну діяльність, що пов’язані з університетом. Вплив авторитетності імен, що пов’язані з університетом, на потенційних студентів відзначає також і Ненсі Овано з Tech Xplore

Wiki Raiting Univer Diagram-1
Розташування університетів світу на діаграмі PageRank – CheiRank (КU – KU*), де KU та KU* є позицією університету у рейтингах на основі алгоритмів PageRank і CheiRank відповідно.
Університети, які посідають місця у топ-100 Шанхайського рейтингу університетів світу позначені кольором від червоного (1-е місце) до синього (100-е місце).
Назви деяких університетів позначені.
Розташування нижче лінії кореляції ранжування двох алгоритмів означає, що університет приділяє велику увагу зовнішнім комунікаціям, а вище цієї лінії – навпаки, комунікує з іншими значно менше.
Джерело: José Lages, Antoine Patt, Dima L. Shepelyansky. Wikipedia Ranking of World Universities. arXiv.org. Опубліковано 29.11.2015.

 

До речі, до важливості цього аспекту схиляється і MIT Technology Review” (Массачусетський технологічний інститут, США), зазначаючи, що сучасні рейтинги не є якісними, оскільки існують, по-перше, культурні, історичні та географічні (а не рідко й особисті вподобання укладачів рейтингів) фактори впливають на рейтинги, що не піддаються кількісній оцінки; по-друге, кількісній оцінці не піддається і те, що з XIX століття англійська мова de facto стала мовою науки, що надає перевагу університетам англомовного світу; по-третє, кількісній оцінці не піддається і те, що деякі університети зосереджуються свою увагу на навчання, позаяк інші – на наукових дослідженнях. Яскравий приклад – Гумбольдтський університет Берліна (Німеччина), який відсутній у топ-100 Шанхайського рейтингу, хоча до нього причетні 29 лауреатів Нобелівської премії, і його появу пов’язують зі значним внесок у гуманітарні науки та мистецтво, ніж у науку взагалі. Хоч цей рейтинг у дечому і недосконалий, і він навряд чи замінить традиційні рейтинги, але, як зазначається у MIT Technology Review”, результати роботи вчених з Франції «дають можливість побачити рейтинг, який може допомогти уникнути упереджень, що виникають при укладанні інших рейтингів, а тому “рейтинг Вікіпедії” забезпечує новий спосіб отримати ранжування університетів світу та, безперечно, має активізувати дискусію щодо якості рейтингів освітніх закладів». Сюди можна додати також і Геттінгенський університет, який має таку саму ситуацію із потраплянням до рейтингів, що Гумбольдтський університет Берліна.

Неважко зрозуміти, що якість висвітлення у Вікіпедії (№ 1 джерело інформації про світ для звичайного користувача Інтернету) – це рейтинг його популярності та пізнаваності, впливовості його бренду. Крім того, для цього рейтингу відіграє важливу роль і те, наскільки якісно певний університет описаний у Вікіпедії. Так, виявилось, що найбільш репрезентативний алгоритм PageRank має залежність від кількості внутрішніх посилань зі всіх статей у Вікіпедії на статтю про сам університет («імпорт-залежність»). Насправді, це є нічим іншим, як залежність від якості висвітлення університету в цілому, включно з його підрозділами, його діяльності (наукової та культурної), його значимих науковців, викладачів та випускників (відповідно до правил Вікіпедії).  Зрозуміло, що ті університети світу, які (або самі вікіпедисти) приділяють цьому увагу, опинилися нагорі рейтингу.

Загалом у «рейтингу Вікіпедії» за алгоритмом PageRank представлено 1025 університетів світу. Топ-10 ретингу сформували:

  1. University of Cambridge, U.K. (24 вікі мовні розділи)
  2. University of Oxford, U.K.  (24)
  3. Harvard University, U.S. (22)
  4. Columbia University, U.S. (23)
  5. Princeton University, U.S (23)
  6. Massachusetts Institute of Technology, U.S. (21)
  7. University of Chicago, U.S. (22)
  8. Stanford University, U.S. (21)
  9. Yale University, U.S. (20)
  10. University of California, Berkeley, U.S. (19)

А ось 6 українських університетів, які потрапили до цього рейтингу, опинилися на таких місцях:

  • 128 – Львівський національний університет імені Івана Франка (2 вікі мовні розділи: польська – 8 місце; російська – 49 місце);
  • 158 – Київський національний університет імені Тараса Шевченка (2: пол. – 72; рос. – 13);
  • 286 – Харківський національний університет імені В.Н. Каразіна (1: рос. – 14);
  • 441 – Одеський національний університет імені І.І. Мечникова (1: рос. – 32);
  • 645 – Національний університет «Києво-Могилянська академія» (1: рос. – 56);
  • 665 – Національний технічний університет України «Київський політехнічний інститут» (1: рос. – 58);

Разом з тим, «рейтинг Вікіпедії» дещо скоригував розподіл позицій серед університетів. Так, у топ-100 «рейтингу Вікіпедії» опинилось 38 американських університетів, на відміну від Шанхайського рейтингу, де їх аж 52.

А ось до топ-10 університетів «рейтингу Вікіпедії» з країн, що не входять до мовного середовища 24-х мов, які аналізувались у ньому (тобто ті країни, в яких державною/національною не є жодна з цих 24 мов; наприклад, Білорусь за мовним принципом охарактеризована як RU, оскільки там державною мовою є також і російська), опинилось 2 українських університети – Львівський національний університет імені Івана Франка та Київський національний університет імені Тараса Шевченка на 6-й та 7-й позиції відповідно.

Порівняти ТОП-100 Шанхайського рейтингу університетів із «рейтингом Вікіпедії» Ви можете тут. Відзначу, що коливання у першій десятці між Шанхайським рейтингом та «рейтингом Вікіпедії» складає від 2 до 8 позицій, а найбільші не співпадіння серед перших 100 університетів Шанхайського рейтингу помітні в університетів, що виникли у ХХ столітті і мають незначну історію, традицію та наукову школу, порівняно з тими університетами, що виникли раніше, особливо до ХІХ століття.

Анімація географічного розподілу університетів по країнах і їх поява у топ-100 університетів усіх 24-х мовних версій Вікіпедії при ранжуванні за алгоритмом PageRank за часом їх появи та історичними періодами (крок у 100 років).
Джерело: сайт проекту «Wikipedia Ranking of World Universities».

 

На цю цікаву річ звернули увагу і автори дослідження, проаналізувавши залежність часу заснування університетів та частоти їх появи у рейтингу відповідно до країн світу. Так, виявилось, що серед університетів, присутніх у рейтингу, заснованих до ХІХ століття, перше місце належить Німеччині, за якою розташувалась Італія, а також США. А вже у ХІХ столітті США виходить на перше місце, утримуючи його до цього часу. При цьому, як зазначається у рецензії, опублікованій у MIT Technology Review”, це пояснюється тим, що «Вікіпедія віддає перевагу більшій культурній та історичній значимості університетів».

За даними рейтингів топ-100 університетів кожного з 24-х мовних розділів Вікіпедії, було створено мережу культурних зв’язків університетів світу з 25-ма вузлами (24 мови – країна чи групи країн, де вони є національними/державними та вузол WR («World»), до якого належать країни, де державною не є жодна мова з 24-х, на основі яких створено рейтинг). Кожна група країн являє собою культурний (мовний) простір, і згадка університету у топ-100 іншого культурного (мовного) простору означає поширення культурних зв’язків з одного культурного (мовного) простору до іншого. Величина вузлів залежить від кількості університетів цього мовного простору у загальному рейтингу, а товщина направлених ліній (від культурного простору із топ-100 університетів до культурного простору, згаданого у цьому топ-100 рейтингу, за винятком внутрішніх зв’язків у цьому культурному просторі) залежить від кількості університетів певного культурного простору, які присутні у топ-100 університетів іншого культурного простору. Перше місце за кількістю представлених у «рейтингу Вікіпедії» університетів, звісно, посідає англомовний світ, друге – німецькомовний, а третє – WR (група країн «World»). Зрозуміло, що університети англомовного світу найбільш активно представлені у топ-100 університетів решти світу. На другій позиції за цим компонентом – опинились університети німецькомовного культурного простору. А найбільше потраплянь до топ-100 університетів групи країн «World» в англійській, малайській та російській Вікіпедіях.

 

Wiki Raiting Univer Diagram-2
Мережа культурних зв’язків між різними культурними (мовними) просторами між 24 мовними розділами Вікіпедії відповідно кількості згадок у топ-100 рейтингах університетів кожного з 24-х мовних розділів Вікіпедії.
Величина вузла пропорційно кількості університетів у «рейтингу Вікіпедії» за алгоритмом PageRank. Ширина направленої лінії пропорційна кількості університетів іноземних країн, присутніх у топ-100 рейтингу університетів певного культурного простору.
Джерело: José Lages, Antoine Patt, Dima L. Shepelyansky. Wikipedia Ranking of World Universities. arXiv.org. Опубліковано 29.11.2015.

 

Цікаво, що у рецензії на дослідження у MIT Technology Review” звернули увагу на відсутність серед мовних розділів Вікіпедії, які аналізувались, української Вікіпедії (мови), зазначивши, що тоді б сам рейтинг був би інакшим. Зазначу, що на середину лютого 2013 року, коли було взято дані для «рейтингу Вікіпедії», українська Вікіпедія за кількістю статей посідала 14-те місце серед усіх мовних розділів, але нині вона обіймає 16-те, поступившись у липні 2013-го себуанській та варайській Вікіпедіям, які використовували ботозаливку (створення заготовок статей за допомогою автоматичних або напівавтоматияних користувачів-програм, написаних  на мові Python).

Вікіпедія вже змінила світ, адже її існування змусило найпопулярнішу, найповажнішу енциклопедію англомовного світу «Британіку» відмовитись від паперового видання і перейти на цифровий формат на CD/DVD-дисках. Сподіваюсь, що подібні рейтинги, базовані на статтях у Вікіпедії, будуть оновлюватися регулярно, а відтак відображати зміни у самій Вікіпедії, яка постійно розвивається, та вподобання людей у всьому світі (такий собі «рейтинг престижності та впливовості» або навіть «рейтинг запитуваності інформації»). При цьому роль людських вподобань та тяжіння до впливовості імен, як зазначає MIT Technology Review”, університети намагаються применшити, але вони, тим не менш, мають вплив на їх фінансування!

Цей рейтинг засвідчив, що Вікіпедія є однією з провідних інформаційних технологій у сучасному світі. Наявність статті у Вікіпедії, якщо вона, звісно, написана відповідно до правил Вікіпедії, означає не тільки визнання значущості події, явища, об’єкта чи людини, а також є мірилом впливовості, відомості та пізнаваності, що йде через часи.

З цього випливає, що для отримання пізнаваності, визнання і набуття впливовості в інформаційному просторі нам необхідно активно «просувати» українську освіту, культуру, будь-що іншими мовами у Вікіпедії, яких нині вже 291 (ясна річ, що не російською, бо «Russian» нині у цивілізованому світі вже по суті є лайкою; наголошу, що дані були зібрані у лютому 2013 року, коли Росія ще не показала своє справжнє обличчя в Україні).

Ти цікавий світу, якщо виробляєш якісну продукцію, особливо, інтелектуальну та інформаційну та вмієш її просувати на глобальному ринку. Власне, це правило добре застосовується і до «рейтингу Вікіпедії», оскільки вища позиція у ньому напряму залежить також і від того, у скількох мовних розділах Вікіпедії присутня стаття про університет (разом з вихідними і вхідними посиланнями у Вікіпедії із/на статтю про нього).

Нарешті, якість висвітлення інформації у Вікіпедії про університет (або будь-що інше) – це престиж та впливовість університету, що, зрозуміло, у наш час, коли левову частку інформації ми отримуємо через Інтернет, є свого роду ще однією конвертованою валютою. Врешті-решт, ця конвертована валюта приводить із собою реальні гроші. А Вікіпедія є найкращою та найшвидшою інформаційною технологією донесення інформації до людини: якщо хтось користується Інтернетом, то він або вона хоч раз, але заглядали до Вікіпедії.

До речі, автори відзначають, що у кожному мовному розділі приділяється більша увага «своїм» університетам (тобто тим, які походять з країн, де як державна використовується та чи та мова). Тому таке «просування» іншими мовами дуже важливе, оскільки у такому випадку ми не зосереджуємось на своєму національному горизонті, а активно входимо до глобального інтелектуального та інформаційного простору.

Вікіпедія впливає на людей, їй довіряють, і тому гріх не користатися нею! Зрозуміло, що відповідно до правил Вікіпедії, адже самопіар та реклама (відверте просування чого-небудь) у Вікіпедії суворо заборонені.

P.S. Власне, як показав час, мої слова знайшли підтвердження за допомогою спеціальних досліджень, базованих на математичних алгоритмах. Я випередив час, бо казав про речі, які не були на той час виміряні? Ні, просто я знаю про що кажу, бо я дивлюсь на явища у багатовимірному розрізі, з врахуванням майбутніх тенденцій. Так і хочеться додати: «А ми казали!».

 

Сергій Петров, ІЦ «Майдан Моніторинг», вікіпедист.

Über Сергій Петров 248 Artikel
історик, аналітик Інформаційного Центру "Майдан Моніторинг" (сайт "Майдан"), громадський активіст, редактор української Вікіпедії