Доклад на Тринадцатой Ежегодной Международной Междисциплинарной конференции по иудаике. М., 2006.
Известен метод исследования отношения к тем или иным национальностям путем измерения частот, с которыми респонденты выбирают из списка характеристик те, которые ассоциируются у них с данными национальностями. Предложен аналогичный метод, использующий не анкетный опрос, а материалы в Интернете. Для анализа выбраны национальности, по которым имеются надежные данные, полученные "Аналитическим центром Левады" - евреи, русские, азербайджанцы, англичане. Проведены несколько возможных видов анализа характеристик, связываемых в Интернете с этими национальностями. Выбран оптимальный метод анализа. Рассмотрены возможности развития метода.
Отношение к тем или иным национальностям, складывающееся в обществе, представляет интерес по меньшей мере в трех аспектах. Во-первых, на уровне контактов общество-общество: трудно ожидать нормальных отношений между странами А и В, если жители страны А ненавидят населяющий страну В народ. Во-вторых, на уровне контактов личность-общество: отношение человека к инициативе, исходящей из страны В, будет зависеть от его отношения к национальности, населяющей страну В. В-третьих, на уровне контактов личность-личность: отношение человека к другому человеку будет (по крайней мере, на начальном этапе) зависеть от его отношения к национальности контактанта (который, будучи осведомлен о этом отношении, может знанием воспользоваться, причем несколькими способами).
Методы исследования отношения можно разделить на три группы - это исследования действий, спонтанных высказываний и ответов на вопросы социологов. Каждая группа методов имеет свои плюсы и минусы. Например, отношения, выраженные в действиях (вандализм на кладбище или усыновление ребенка, принадлежащего к отличной от приемных родителей национальности), хороши своей юридической достоверностью, но плохи малой статистикой и низкой разрешающей способностью. Кроме того, в некоторых случаях действия ("он на него косо посмотрел") трудно фиксируемы. Ответы на вопросы анкет хороши тем, что сами вопросы могут быть тщательно подготовлены, многократно оттестированы и используемы на протяжении длительного времени, но плохи тем, что сама ситуация анкетирования является искусственной и в ряде случаев толкающей респондента на сознательную или бессознательную корректировку своих высказываний. Анализ спонтанных высказываний хорош тем, что "респондент" находится в естественной обстановке и в меньшей степени цензурирует себя, но плох тем, что сам анализ в этом случае сложнее анализа ответов на анкетные вопросы.
По мере развития Интернета роль анализа спонтанных высказываний будет, как нам кажется, возрастать - хотя бы по двум техническим причинам. Во-первых, доступ к интернет-версиям печатных изданий способен сделать анализ текстов менее трудоемким. Во-вторых, наличие в Сети многочисленных форумов, блогов, гостевых книг и т.п. с их речью, приближенной к живой устной, также увеличивает количество материала для анализа. Каковы вообще могут быть методы анализа текстов (коими пока что Интернет в основном и является)? Первый метод - это традиционный контент-анализ, установление того, с чем ставится в один ряд наш объект или какие его связи рассматриваются, насколько достоверно и глубоко его анализируют, как характеризуется объект и т.п. Опыт применения контент-анализа российской прессы для исследования отношения к национальности имеется (нами рассматривалось отношение к евреям и Израилю, в частности, впервые было замечено окончание периода произраильских настроений в либеральной прессе). Применение контент-анализа требует содержательного анализа текста человеком, что делает методику трудоемкой. Кроме того, содержательный анализ, проводимый человеком, уменьшает объективность, хотя для отслеживания трендов и сравнительного анализа разных изданий метод пригоден.
Второй метод - это вычленение из текстов всех упоминаний заданной национальности с прилагательными (или иными характеристиками) и анализ полученного материала. При этом немедленно возникает вопрос - какие вообще характеристики рассматривать? Можно взять именно те характеристики, которые употреблялись в анкетах социологов (в том или ином исследовании) и сравнить частоты выбора этих характеристик в опросе и называния этих характеристик в Интернете.
Этот подход оказался, однако, неудобен, потому что частота употребления эпитетов в спонтанной письменной речи (речи Интернета) регулируется своими законами: например, язык избегает сложных конструкций и слов, а "социологические" слова при формулировке анкеты с закрытыми вопросами выбираются, исходя из требующейся точности зондирования того или иного отношения в условиях опроса. В результате "социологические" слова в интернет-речи используются в десятки и сотни раз реже, чем прочие. И несмотря на необъятность Интернета, сочетание названия конкретной национальности с конкретной характеристикой может встречаться слишком редко для того, чтобы данные были оказались репрезентативны.
Можно было бы использовать для поиска те слова, которыми респонденты характеризуют различные национальности в открытых вопросах анкет, но такие данные известны только для учащихся московских национальных школ (В.Д.Шапиро, М.Г.Герасимова) и жителей Перми (О.Л.Лейбович, В.Н.Стегний, А.Н.Кабацков, Н.В.Шушкова, http://www.hse.ru/journals/wrldross/vol04_2/ogl.htm ). Кроме того, спонтанная письменная речь Интернета отличается от спонтанной устной речи ответов на открытые вопросы анкет.
Можно пойти не по социологическому, а по психологическому пути, взять какой-нибудь стандартный список характеристик человека и собрать статистику в Интернете. Но проблема, аналогичная той, что возникает при анализе "социологических характеристик" возникла и здесь.
Поэтому мы выявили все характеристики, которые использует интернет-речь для выбранных нами для анализа национальностей (англичане, азербайджанцы, русские, евреи) и измерили частоту употребления их для всех четырех названных национальностей. Сами национальности были выбраны из тех же соображений, которыми руководствовались социологи (Л.Д.Гудков - Аналитический Центр Юрия Левады): англичане - представители "Запада", азербайджанцы - представители "Востока". В дальнейшем мы предполагаем расширить список. На данном этапе мы игнорировали наличие синонимичных названий национальностей, как нейтральных, так и окрашенных, хотя в ряде случаев они составляют заметную долю от основного словоупотребления. Так, около 50% составляют британцы, британец и британка от англичан, англичанина и англичанки соответственно, около 25% - составляют чурки от азербайджанцев и жид от еврея (заметим, что значение "чурки" и "британца" шире, чем "азербайджанца" и "англичанина"). Исследовался русскоязычный Интернет, причем разделение высказываний на оценки и самооценки не делалось, хотя оно при анализе контекста почти всегда возможно. Равным образом, не анализировались демографические характеристики авторов высказываний - хотя считается, что состав пользователей Интернета сейчас не сильно отличается от всего населения, но характеристики авторов текстов и тем более высказываний на форумах могут отличаться сильнее.
Измеренные частоты были нормированы на общую частоту употребления наименования данной национальности в Интернете. Тем самым были получены относительные частоты употреблений всех эпитетов (случаи использования слов "русские" как прилагательного исключались). Для примера приведем по семь наиболее частых характеристик каждой национальности (в скобках - относительные частоты 106). Англичане - сдержанные (2300), странные (1000), хитрые (630), богатые (540), умные (290), глупые (270), наивные (240); азербайджанцы - забавные (470), богатые (380), хитрые (280), умные (130), культурные (120), наивные (67), честные (56); русские - тупые (750), умные (470), горячие (420), надежные (360), глупые (300), богатые (280), честные (170); евреи - религиозные (4600), умные (900), хитрые (550), богатые (390), честные (290), жадные (230), глупые (210). Данные списки не могут считаться исчерпывающими в силу некоторых особенностей работы поисковых программ; для построения исчерпывающих списков должно быть использовано специальное программное обеспечение.
Эти списки можно использовать разными способами. Например, можно для каждой пары национальностей из списка вычислить "расстояния", как сумму модулей разностей относительных частот употреблений всех эпитетов. Эти расстояния оказались следующими (в порядке возрастания "расстояния", 106). Азербайджанцы - русские: 3000; англичане - азербайджанцы: 5600; англичане - русские: 6300; азербайджанцы - евреи: 7200; русские - евреи: 7700 и, наконец, англичане - евреи: 10000. Такая же процедура может быть проделана для наименований не народов (англичане, русские...), а лиц (англичанин, русский... англичанка, русская...).
Наконец, последний метод анализа, использованный нами, является качественным и состоит в следующем. Для всех лиц четырех названных выше национальностей определялись наиболее часто употребляемые прилагательные и глаголы и делалась попытка составить примитивный текст на основе только этих прилагательных и глаголов, причем для каждого лица - с соблюдением ранга характеристики.
Богатый и старый, но неутомимый англичанин изобрел и выставил на аукционе нечто такое, за что получил много денег и решил - вот моя любимая молодая и типичная англичанка. Еще вчера она родила, отбилась от грабителя и отомстила. Тут откуда ни возьмись молодой, рослый, типичный азербайджанец, который зарезал и изнасиловал, несмотря на присутствие рядом молодой, настоящей, русскоязычной азербайджанки, а потом взял что-то и говорит - я продал это старому, бедному, нормальному ортодоксальному еврею, который купил, сел и сказал - один я остался! Где моя старая, чистокровная, галахическая и красивая еврейка, которая когда-то пришла, сказала, вышла замуж и родила, где великий и одинокий русский брат? Тот ответил - вот он я: родился, женился, сел и написал. А еврей - нет, это я сделал! Русский - зато вот моя молодая, новая и простая русская. Когда она вышла за меня, она сказала мне кое-что, но не бросила, как азербайджанка, и не инсценировала - хотя, как та, и родилась.
В заключение отметим, что сегодня Интернет - это в основном тексты. Но можно представить себе по крайней мере три вида материалов, которые потребуют иных методов анализа. Во-первых, это изображения. Можно вообразить себе иной, "картиночный" Интернет. Во-вторых, это материалы с преобладанием гипертекста над собственно текстом, с большой концентрацией гиперссылок и переходов. Разумно предположить, что метод анализа должен как-то учитывать эту особенность. В-третьих, это непрерывный диалог, нечто вроде бесконечных обменов репликами в чатах. Вероятно, в этом случае метод анализа должен учитывать не только "что сказано", но и в ответ "на что" сказано это.
Данная работа имеет пока в основном методический смысл и направлена на выбор пути дальнейшего исследования, а к конкретным данным надо относиться с осторожностью. Авторы благодарны за полезное обсуждение Б.В.Дубину (Аналитический Центр Юрия Левады). Эта работа является частью наших исследований Интернета, другие аспекты см. http://fmsh.miem.edu.ru/Statya9.html и http://www.ito.su/main.php?pid=26&fid=5224.