С.Ю. Жданова, С.Л. Мишланова, В.Б. Поляков, Е.А. Рабчевский

ОСОБЕННОСТИ РЕПРЕЗЕНТАЦИИ ЭТНИЧЕСКОЙ АГРЕССИИ В КОРПУСЕ СООБЩЕНИЙ…___________________________________________________________________________  
УДК159.922.4

ОСОБЕННОСТИ РЕПРЕЗЕНТАЦИИ ЭТНИЧЕСКОЙ АГРЕССИИ В КОРПУСЕ СООБЩЕНИЙ ПЕРМСКОГО СЕГМЕНТА СОЦИАЛЬНОЙ СЕТИ «ВКОНТАКТЕ» (VK.COM)

 

© 2012

  С.Ю. Жданова, доктор психологических наук, заведующая кафедрой психология развития

 С.Л. Мишланова, доктор филологических наук, заведующая кафедрой лингводидактики
В.Б. Поляков, старший преподаватель кафедры компьютерных систем и телекоммуникаций
Е.А. Рабчевский, ассистент кафедры кафедры компьютерных систем телекоммуникаций

Пермский государственный национальный исследовательский университет,

Пермь (Россия)

 

Ключевые слова: этническая толерантность, этническая агрессия, медиатексты, краевой корпус.

Аннотация: в статье рассматривается задача формирования корпуса сообщений пермского сегмента социальной сети vk.com, содержащих феномены этнической агрессии. Описывается методика создания компьютерной программы, позволяющей выявлять феномен этнической агрессии. Представлены результаты поиска феноменов этнической агрессии на страницах пермских пользователей социальной сети Вконтакте.

.

   В настоящее время в связи с осложнением межэтнических отношений, социально-экономическим расслоением населения, проявлениями нетерпимости к человеку другой веры, этнической принадлежности особую актуальность приобретает проблема поиска способов и средств мирного и гармоничного сосуществования носителей разных мировоззрений, культур.

   Особенно остро данная проблема стоит сегодня для Пермского края, поскольку Пермский край является многонациональным, в нем проживают более 123 национальностей, многие из которых официально зарегистрированы и имеют статус диаспор. Духовное опустошение, искажение ролей, переживание большинством населения в 90- годы чувства утраты, девальвации привычных ценностей вызывают глубинное чувство агрессии, которое особенно остро переживается молодежью, подростками.

   Отсутствие навыков саморегуляции, адекватных способов выражения своих чувств приводят к деструктивному поведению со стороны молодежи, противоречащему нормам и правилам существования людей в обществе и наносящим существенный вред.

  Агрессия молодежи может быть направлена не только на себя (различные формы аутоагрессии, рост суицидальных попыток в возрасте от 13-16 лет), но и по отношению к другому, как представителю другой веры, этноса, культуры. Так, в исследованиях было показано, что национальность относится к числу характеристик, воспринимаемых в индивидуальности с первых секунд восприятия [4; 5; 11]. В дальнейшем данная характеристика не претерпевает изменений, является постоянным, константным признаком в процессе познания индивидуальности человека [4; 5; 11]. Одной из форм проявления агрессии выступает терроризм [3; 8]. В основе терроризма лежит искаженное изображение о другом как агрессивном объекте. Сегодня создается опасность, что молодое поколение в силу недостаточной критичности мышления, может быть подвержено внушению, негативному воздействию извне, в том числе со стороны лиц, проявляющих экстремизм.

   Одним из наиболее распространенных видов молодежного экстремизма является сегодня информационный экстремизм [1, с. 52]. Информационный экстремизм – это деятельность, осуществляемая с использованием информационных технологий, сопряженная с формами социально-психического и опосредованного физического деструктивного влияния, результатом которого является достижение публично нелегитимных и противоправных целей [9, с. 52]. Активизация информационного экстремизма в глобальной сети Интернет обусловлена не только прогрессом коммуникативных и информационных технологий, развитием современных средств связи (Интернет, мобильная связь, телевидение), но и государственной политикой России, осуществляемой в 2000-е гг.

   Жесткий контроль над средствами массовой информации, обусловливает рост популярности альтернативных источников информации, в частности, Интернета. Контролируя традиционные СМИ, власти вынуждаю экстремистов уйти с телевидения в виртуальную сеть, где контроль минимален. В связи с этим информационный экстремизм сегодня все чаще реализуется посредством сети Интернет, находит отражение в таких элементах интернет-пространства как форумы, блоги, которые становятся особенно популярными среди молодежи, а с другой стороны, активно используются информационными экстремистами в своих целях [1, с. 52; 2; 3; 10]

   Одним из важных направлений работы, служащих профилактике проявлений экстремизма и способствующих формированию толерантного сознания молодежи может служить анализ Интернет-ресурсов, в которых проявляются феномены этнической агрессии. С целью анализа Интернет-ресурсов, репрезентирующих феномен этнической агрессии, нами было осуществлено специальное исследование.

   В качестве объектов анализа выступили сообщения, расположенные на страницах пермских пользователей социальной сети Вконтакте. Выбор данного источника информации был обусловлен тем, что в социальных сетях представлена информация о месте нахождения источника информации. Просматривая владельцев персональных страниц социальной сети Вконтакте, пользователь изначально может видеть место жительства интересующего его человека или группы.

   В качестве методов исследования были использованы методы разметки корпуса медиа-текстов, метод компьютерного контент-анализа текстов, блогов; корпусный анализ текстовых массивов на основе ключевых слов, метод моделирования. Для выявления Интернет-ресурсов, имеющих этнически агрессивную направленность, требуется решить задачи по поиску и анализу этих ресурсов. Кроме того, необходимо определить локализацию информационного источника, которая может пониматься по-разному, например, откуда автор, или где размещается сайт, или какой регион рассматривается (упоминается) в сообщении.

   Задача поиска информации в сети решается с помощью специальных поисковых компьютерных программ, которые перебирают ресурсы Интернета и заносят информацию о просканированных сайтах в базу данных поисковой системы, такие программы называются веб-краулером (или поисковым роботом, или “веб-пауком”). Краулер формирует запросы интернет-ресурсу, получает ответы от него, которые после обработки заносит в базу данных с присвоением метрики (или выделением признаков) релевантности, на основании которой можно оценить степень соответствия документа заданным критериям поиска. После занесения интернет-ресурса в базу данных последний считается проиндексированным.

   Критерии и алгоритмы индексации зависят от задач, решаемых поисковой системой, и определяют вид краулера: универсальный или специализированный (тематикоориентированный). Универсальные краулеры часто обладают избыточной функциональностью, сильно нагружают сетевые ресурсы и проигрывают специализированным по таким показателям, как время сканирования веб- пространства, производительность обработки информации, а также возможность направленного поиска информационных источников в рамках определенного критерия значимости. При очевидных преимуществах специализированных краулеров, они имеют и существенный недостаток – для каждой специализации нужен свой поисковый робот, что влечёт значительные затраты на изготовление системы.

   Эффективное решение поставленной задачи возможно с помощью специализированного веб-краулера, который создавался поэтапно. На первом этапе был создан краулер, имитирующий просмотр веб-страниц реальным пользователем страницы пермского сегмента социальной сети Вконтакте. Данная программа была зарегистрирована, свидетельство № 2012614030 на поисковую систему SEUS. Краулер напи- сан на высокоуровневом языке программирования Ruby [http://www.ruby-lang.org/en/]. В качестве СУБД (Система Управления Базами Данных) в системе был использован MySQL-сервер [http://www.mysql.com].

   Созданный краулер имеет ряд особенностей. Для сканирования ресурсов Интернет краулеру требуется полностью имитировать работу реального пользователя, который использует веб-обозреватель (веб-браузер), что достигается посредством формирования определенной последовательности HTTP-запросов (HyperText Transfer Prоtocоl (HTTP) — “протокол передачи гипертекста”), отправляемой на сервер сети. Ответы сервера, которые являются сообщениями со страниц пользователей, сохраняются краулером в базе данных. Часть страниц пользователей требуют идентификации источника запроса, для решения этой проблемы краулер авторизуется на сервере vk.com как зарегистрированный пользователь. Учитывая, что при чрезмерной активности пользователь блокируется сервером vk.com, перед переходом на следующую скани- руемую страницу краулер делает паузу в 1 секунду, что заметно увеличивает время обхода веб-ресурса.

   Чтобы ускорить процесс сканирования, в программе реализована многопоточность формирования и обработки запросов – при каждом обращении к серверу создается новый поток. Программа может работать в нескольких режимах: с использованием авторизации и без авторизации. Режим без авторизации используется для предварительного обхода страниц пользователей, доступ к которым открыт, что позволяет сэкономить время сканирования веб-ресурса.

   В первой версии программы список пользователей был получен через синтаксический анализ (парсинг) вывода стандартного поиска vk.com/search/ (в запросе указывался город Пермь). Оказалось, что стандартный поиск vk.com/ search/ ограничен выдачей в 1000 человек. Во второй версии это ограничение было преодолено за счёт того, что краулер получает список друзей пользователя, которые проживают в городе Перми, сохраняет их в базу данных и заносит в очередь для запроса, после чего процедура повторяется с каждым из новых найденных пользователей. Таким образом, удаётся выявить значительно большее количество пользователей, соответствующих кретерию поиска.

   В первой версии краулера, собранная им коллекция составила 23318 сообщений 1000 человек, что занимает 9.6 MB в базе MySQL. По этим данным релевантных резуль- татов получить не удалось (не удалось с помощью поиска по полученной коллекции найти документы, содержащие феномены этнической агрессии, в качестве поисковых запросов использовались термины из специального словаря этнической агрессии). Высказывания носили общий характер.

   Во второй версии коллекция была расширена до 1152586 сообщений 63770 человек, что занимает 493.6 MB. В этой выборке была достигнута релевантность по запросам – терминам словаря этнической агрессии. Были найдены лица, публикующие видео с убийствами и расправами, демонстрацией оружия, съёмками избиений в Перми, нацистскими жестами на фоне живого огня и т.д.

   На втором этапе, полученный корпус индексируется системой полнотекстового поиска Sphinx [http://sphinx- search.com]. В результате чего к корпусу добавляется ин- декс, который с помощью системы Sphinx позволяет очень быстро осуществлять полнотекстовый поиск по всем сообщениям корпуса.

   На третьем этапе формировался специальный словарь терминов, употребление которых в документе может свидетельствовать о феноменах этнической агрессии. Проводился поиск каждого термина словаря в полученном корпусе, полученные результаты вручную ранжировались экспертом на предмет наличия в документе феноменов этнической агрессии. Таким образом, термины словаря были отсортированы по уровню корреляции наличия в документе термина словаря и наличия в документе феноменов этнической агрессии. Далее релевантные документы анализировались экспертами, и в них выделялись новые термины, которые можно было занести в словарь. Такая последовательность действий повторялась несколько раз, в результате чего была получена актуальная версия словаря.

   При формировании пула запросов краулер использует данный словарь. Применительно к предметной области экстремизма, запросы могут использоваться для выявления принадлежности к организации, быть религиозными и национальными (ислам, мусульмане, чеченцы, кавказцы), содержать жаргонизмы (хач, зиг, коловрат), включать лозунги (слава Руси, бей жидов). Анализ сформированного корпуса позволяет расширить пул запросов краулера новыми терминами и жаргонизмами, полученными из текста.
  Сообщения, полученные с применением поиска по терминам из словаря, могут носить нейтральный оттенок, это происходит, например, при цитировании новостей, пересказе анекдотов или при использовании ключевых слов в любом не экстремистском контексте. Максимально релевантными (по соотношению количества экстремистских высказываний к общему количеству высказываний) оказываются специальные слова, используемые только в экстремистской среде. Ниже приведен список некоторых терминов словаря, ранжированный по уровню корреляции с феноменами этнической агрессии:

52,6% Зиг - 20 / 38

44% Хач - 4 / 9

33% Бритоголовый - 2 / 6

33% Коловрат 2 / 6

20% Слава Руси - 2 / 10

13,7% Национализм - 4 / 29

11% Чеченцы - 2 / 18 + новости (5) как чеченцы русских убивают

6,1% Кавказцы - 3/49 но 90% отрицательные новости

 4,3% Ислам - 1 / 23 + новости

3,7% Мусульмане 2 / 53

   Здесь в процентах и в виде простой дроби указано соотношение релевантных документов к общему количеству документов, содержащих данные термины.  

   Составление словаря-глоссария терминов этнической агрессии имеет важное методологическое значение, поскольку позволяет оптимизировать представления о данной предметной области посредством применения онтологического инжиниринга и составления онтологий. Онтологии, или иерархические концептуальные структуры, которые формируются аналитиком на основе изучения и структурирования протоколов извлеченных знаний и документации считаются ведущей парадигмой структурирования информационного контента (Гаврилова 2003; Гаврилова, Хорошевский 2001). При этом онтология как концептуальная модель предметной области, состоит из иерархии понятий предметной области, связей между ними и законов, которые действуют в рамках этой модели. В ходе создания онтологии все понятия предметной области делятся на классы, подклассы, экземпляры.

   Экземпляры могут быть как у класса, так и подкласса и описываются они фреймом (Минский, 1979). Разработка онтологий, таким образом, включает методы извлечения знаний и алгоритмы категоризации и структурирования (образование концептов и выявление связей). Иными словами, сначала на основе глоссария предметной области устанавливаются связи между понятиями глоссария и производится их визуализация, производится категоризация понятий и формирование метапонятий, границы онтологии. После этого происходит выделение классов, организация их иерархии классов и формирование фреймов для описания классов, подклассов, экземпляров через определение слотов, т.е. свойств. В конечном итоге происходит определение значений, что создает предпосылку для последующей систематизации репрезентации знаний в виде семантических сетей, тезаурусов и т.п. Принимая во внимание итеративность формирования онтологий, особую актуальность приобретают такие методы онтологического инжиниринга, которые репрезентируют динамику концептуализации и вариативность онтологии.

   В нашем исследовании на основе итеративно расширяющегося глоссария этнической агрессии была построена онтология, или модель предметной сферы «экстремизм», более подробное обсуждение которой представлено в (Мишланова, Куприянычева 2012) [8].

   Полученный таким образом, словарь можно будет использовать для поиска ресурсов, содержащих феномены этнической агрессии, не только в социальных сетях, но и в любых других ресурсах. Решение данной задачи позволит контролировать распространение нежелательной информации, выявлять центры распространения нежелательной информации, выявлять опасных потенциально опасных пользователей и групп, собственно, находить информацию, способную помочь при борьбе с этнической агрессией.

СПИСОК ЛИТЕРАТУРЫ

1. Асатрян Б.А. Информационный экстремизм как технология влияния на современные политические процессы/Технологии формирования толерантного сознания и профилактика проявлений экстремизма в молодежной среде //Материалы Всероссийской молодежной научно-практической конференции с международным участием, г. Екатеринбург, 4-5 мая 2012. С. 51-54.

2. Глухарев Д.С. Борьба с экстремизмом в современном медиа пространстве // Материалы конференции: «Феномен экстремизма и ксенофобии в современной России: факторы генезиса, пути и способы противодействия 9-10 декабря 2010» / редкол.: Л.В. Карнаушенко (отв. ред.), Е.О. Кубякин, Е.М. Куликов, В.Н. Ракачев. Краснодар, 2010.

3. Жданова С.Ю., Мишланова С.Л., Поляков В.Б., Кильченко О.И. Влияние текстов, репрезентирующих феномены этнической агрессии и этнической толерантности, на реципиентов, относящихся к различным этническим группам/ психологическая наука и практика: современное состояние и перспективы развития: Материалы II Форума психологов Прикамья (Пермь, 1-2 ноября, 2012г.). Пермь, 2012 г. С. 56-60.

4. Жданова С.Ю., Нахтарова Э.Е. Восприятие индивидуальности человека на видеозаписи // Вектор науки Тольяттинского государственного университета. 2012. № 4.

5. Жданова С.Ю., Поляков В.Б., Нахтарова Э.Е. Особенности восприятия человека на видеозаписи в связи с продолжительностью ее предъявления // Вектор науки Тольяттинского государственного университета. 2012. №2. С. 115-117.

6. Жуков Д.Н. Молодежь и интернет-форумы: некоторые особенности взаимодействия // Материалы конференции: «Феномен экстремизма и ксенофобии в современной России: факторы генезиса, пути и способы противодействия 9-10 декабря 2010» / редкол.: Л.В. Карнаушенко (отв. ред.), Е.О. Кубякин, Е.М. Куликов, В.Н. Ракачев. Краснодар, 2010.

7. Курячий С. И.: Влияние установок личности на восприятие другого человека // Вопросы психологии №6, 83, стр. 105-109.

8. Мишланова С.Л., Куприянычева Е.А. Особенности репрезентации концепта терроризм в англоязычном дискурсе новостей Интернет-ресурсов /Филологические заметки: сб.науч. тр. В 2-х т. Вып.10. Т.2. Пермь – Лбляна:Изд-во Перм. Гос. Нац. Иссл. Ун-та, 2012. С.265- 267.

9. Салимовский В.А., Ермакова Л.М. Экстремистский дискурс в массовой коммуникации РУНЕТА /Вестник Пермского университета. Российская и зарубежная филология. Вып. 3 (15), 2011. С.71-80. 10. Чупров В.И., Зубок Ю.А. Молодежный экстремизм: сущность, формы проявления, тенденции. М., 2009.

11. Zhdanova S. The image of the future of the Russian, British and Americans /30 International Congress of Psychology, 22-27 July. Cape Town. Souf Africa. 2012

Исследование поддержано РГНФ (проект № 12-16- 59015 а/У)

.

FEATURES OF A REPREZENTATSIYA OF ETHNIC AGGRESSION IN THE CASE OF MESSAGES OF THE PERM SEGMENT OF A SOCIAL NETWORK OF VKONTACTE

© 2012

 S.U. Zhdanova, doctor of psychological sciences, associate professor, head of the Department of Psychology of Development

 S.L. Mishlanova, doctor of philological sciences, professor, head of the department of Lingvodidactics

V.B. Polyakov, senior lecturer of the Department of the Computer Systems and Telecommunications

E.A. Rabchevsky, assistant of the Department of the Computer Systems and Telecommunications

Perm State National Research University, Perm (Russia)

__________________________________________________________________________

Keywords: Ethnic tolerance, ethnic aggression, media texts, regional case

Annotation: This paper deals with the formation of the body posts Permian segment of social network vk.com, contain the phenomenon of ethnic aggression. Describes how to create a computer program that allows to detect the phenomenon of ethnic aggression. The results of the search of phenomena of ethnic aggression in the pages of the Permian users of the social network “Vkontakte”.