МАЙДАН - За вільну людину у вільній країні


Архіви Форумів Майдану

Цікава стаття про структуру мови

07/10/2002 | Горицвіт
http://www.nature.com/nsu/020701/020701-2.html

Мій переклад:

Семантичні зв'язки між англійськими словами роблять тезаурус "тісним світом", як і мережа людських соціальних зв'язків, яка зв'язує всіх нас через шість степенів розділення. Таке відкриття зробили Adilson Motter з колегами в Arizona State University in Tempe. Дослідники припускають, що інші мови мають такі ж властивості, навіть якщо їх семантична структура сильно відрізняється.

Дослідники прослідкували зв'язки між 30 000 англійських слів в онлайновому тезаурусі. Наприклад, слово "actor" можна зв'язати з "universe" через два переходи. Тезаурус вказує "character" як синонім до "actor", а також до "nature", а "nature" - синонім "universe".

Таким чином, перехід від "actor" до "universe" в мережі слів займає три кроки. Несподіваним виявилося, що це справджується і майже для будь-яких випадково вибраних пар слів в тезаурусі. Іншими словами, англійська мова має всього три степені розділення.

Очевидно, що це не для всіх слів справджується: скажімо, "vanadium" і "ambidextrous" буде важче зв'язати. Але дослідники включили в свою мережу тільки "кореневі" слова, які є входами в тезаурус. Багато синонімів, які наводяться під певним ключовим словом, - не ключові слова, - не з'являються більше ніде в тезаурусі. Ключові слова мають тенденцію бути загальними: скажімо, "big", а не "gargantuan".

Мережа тісного світу не задається виключно властивістю, що будь-які дві вершини зв'язані малою кількістю кроків. Вершини мають бути також сильно кластеризованію. Тобто якщо дві вершини зв'язані з третьою, то є велика ймовірність, що вони зв'язані і напряму між собою. Мережа друзів також сильно кластеризована, ви і я маємо спільного друга, то скоріше всього ми знайомі між собою.

Команда дослідників показала, що мовна мережа також сильно кластеризована, наприклад, "nature" вказана під входами "universe" і "world", а "world" також вказане під "universe" (і навпаки).

Дослідники вважають, що така структура мовної мережі ймовірно походить від природи пізнання і пам'яті. Не дивно, що мова сильно кластеризована, якщо ми запам'ятовуємо речі асоціативно, групуючи разом схожі концепти. Так легше діставати схожі слова з пам'яті.

Мережа тісного світу також означає, що цілком різні концепти, такі як "actor" і "universe", тісно зв'язані короткою серією семантичних кроків. Це полегшує ментальний пошук при користуванні мовою: ми можемо дійти до бажаної точки швидко, незалежно від стартової точки. Перехресні посилання в базі даних при такі реалізації були би відносно легкими в обчисленні.

Згідно з цим аргументом, мова набула теперішньої структури, тому що ця структура легка в використанні. Слова набули багатозначості через те, що це робить мережу сильно взаємозв'язаною, так що середня довжина шляху між двома словами мала. Але ще треба подивитися, чи справді пошук слова в пам'яті спричиняє ментальне проходження по зв'язках у цій мережі.


Copyleft (C) maidan.org.ua - 2000-2024. Цей сайт підтримує Громадська організація Інформаційний центр "Майдан Моніторинг".