Ads 468x60px

Saturday, March 9, 2013

Российские учёные погрузились в соцсети

Как узнать, о чём думают пользователи социальных сетей? Какие темы обсуждает блогосфера, с какой скоростью по ней расходятся слухи, как выявить очаги распространения новостей и предсказать реакцию людей на то или иное событие? Портал «Социодинамика», разработанный сотрудниками Института наукоёмких компьютерных технологий НИУ ИТМО, даёт исследователям инструмент для поиска ответов на эти вопросы.

Науки об обществе традиционно основываются на данных. Можно брать обобщённые данные, например использовать разного рода статистику. Но статистика – это уже собранные и обработанные в каких-то целях сведения, для содержательного исследования их может быть недостаточно. Поэтому создатели портала «Социодинамика» решили дать коллегам-гуманитариям возможность собирать первичные данные в социальных сетях и на основе этого – моделировать поведение соцсетей.

Процедура сбора данных в социальных сетях называется краулингом. Она отличается от обычного поиска тем, что связана с топологией сети, то есть позволяет не просто искать необходимую информацию, но и выяснять, как связаны между собою люди, которые её публикуют. «В социальных процессах существенную роль играют не только свойства индивидуумов, но и, в первую очередь, структура связей между ними», – объясняет Александр Бухановский, директор НИИ Наукоёмких компьютерных технологий.

Как это работает?

Краулер ищет в соцсетях открытую информацию по определённым критериям. Можно искать по ключевым словам, словарикам или семантическим правилам профили пользователей, страницы или отдельные посты, которые позволяют определять так называемых релевантных пользователей. Например, по тематическому словарю «наркотики» краулер находит сначала одного пользователя, который обсуждает эту тему в сети, затем начинает проверять тех пользователей, с которыми он связан: обсуждают ли они подобные вопросы. Поиск заканчивается, когда собраны необходимые данные или просмотрен весь перечень «друзей», после чего алгоритм переходит к поиску следующего релевантного пользователя. Таким образом, краулер позволяет собирать тематическую информацию в социальных сетях с учетом её «свежести», выявляя, кто что нового сказал по заданной теме.

Собранные данные формируют комплексную сеть, узлы которой – отдельные пользователи. Они могут выкладывать в сеть информацию о себе: интересы, личные данные, и быть связаны друг с другом разными способами. Это может быть цитирование чужих сообщений, дискуссия на определённую тему или формальное нахождение в «друзьях». По структуре сети и анализу её статистики можно сделать вывод о том, какими свойствами она обладает, насколько хорошо она проводит информацию, насколько устойчива к разрушению и как меняется в зависимости от ситуации.

Знания о структуре и статистических характеристиках сети позволяют моделировать и прогнозировать процессы её роста, разрушения и распространения информации. При моделировании учитываются вероятности того, что кто-то из пользователей передаст информацию дальше, кто-то – нет, кто-то её примет, кто-то не отреагирует. Например, кого-то из пользователей сети она не заинтересует, а кого-то просто может не быть онлайн.
 
Зачем это нужно?

Инструменты «Социодинамики» дают возможность выявить, что собой представляет то или иное сетевое сообщество, насколько оно связно, есть ли в нём ярко выраженные лидеры, как и по каким каналам идёт информация. А на основании этого уже можно решать прикладные задачи и делать прогнозы. Например, если мы хотим передать срочную информацию, то можно спрогнозировать, за какое время она дойдёт до всех участников, сколько из них может быть не оповещено и прочее. А также решать задачи управления: например, каким образом можно наиболее эффективно разрушить эту сеть, чтобы информация не дошла до большинства её участников.

К настоящему моменту система, разработанная учёными из ИТМО, успешно прошла проверку практикой. Совместно со специалистами Информационно-аналитического центра Санкт-Петербурга она использовалась для анализа распространения наркотиков в городе. При этом данные соцсетей, связанные с наркотиками, анализировались и сопоставлялись с данными, которые были получены в ходе традиционных оперативных действий. Оказалось, что очень многие закономерности распространения наркомании имеют своё отражение в социальных сетях. Не только качественно, но даже и количественно.
 
Кто этим пользуется?

В первую очередь портал применяется в учебных целях. «Проведённый нами анализ показал – на большинстве гуманитарных факультетов отечественных университетов такие дисциплины, как социодинамика, вычислительная социология и подобные, преподаются в основном в рамках лекционных занятий с весьма небольшим практикумом. А мы фактически создали виртуальную лабораторию, то есть рабочее пространство в интернете, где учащиеся могут и лабораторные работы выполнять, и исследования проводить. При этом студенты работают с реальными данными, которые постоянно обновляются», – рассказывает Александр.

Портал «Социодинамика» публичен – базовые возможности открыты для всех желающих. Нужна, однако, регистрация, которая обрабатывается вручную. Чтобы получить аккаунт, следует подробно рассказать, какую задачу вы хотите решать, какие ресурсы использовать, какую загрузку это предполагает. «Сейчас мы не предоставляем данный продукт на коммерческой основе. Однако такой вариант возможен, если мы будем поддерживать виртуальные лабораторные практикумы для других учебных заведений», – отвечает Александр на вопрос о финансовой составляющей проекта. Система работает на платформе облачных вычислений CLAVIRE, развёрнутой в НИУ ИТМО. Никакой специальной инфраструктуры для проекта «Социодинамика» создавать не пришлось – он использует имеющиеся мощности, когда они свободны. Это и позволяет пока что, в пилотном режиме, предоставлять сервис бесплатно.

No comments:

Post a Comment