Гендерное профилирование автора субстандартного текста
Автор: Красса Сергей Иванович, Калугина Елена Николаевна
Журнал: Вестник Южно-Уральского государственного университета. Серия: Лингвистика @vestnik-susu-linguistics
Рубрика: Лингвистика текста
Статья в выпуске: 3 т.11, 2014 года.
Бесплатный доступ
Предлагается методика гендерного профилирования субстандартных текстов на основе разнообразных языковых и экстралингвистических характеристик: лексических, морфологических, синтаксических, стилистических, эрративных и фоносемантических параметров путем сужения показателей атрибуции текста сначала до гендерно идентифицирующих и затем до субстандартно идентифицирующих. Методика включает в себя три этапа, а именно: определение способов анализа и инструментария (использующееся также в атрибуции текста); затем актуализация параметров, характерных для различия автора по полу; на последнем этапе происходит сужение на материале субстандартных текстов. При этом последовательность спецификации «гендер / субстандарт» может быть изменена.
Атрибуция текста, гендер, текстовые параметры, компьютерная программа, субстандарт
Короткий адрес: https://sciup.org/147153909
IDR: 147153909
Текст научной статьи Гендерное профилирование автора субстандартного текста
В гендерной лингвистике на современном этапе отмечается разнообразие идей относительно ключевых концептов научного направления, начиная от предложения ввести понятия «языковая личность мужчины» и «языковая личность женщины» [6] и заканчивая обоснованием термина «гендерлект» [5], и это разнообразие предопределяет необходимость проведения гендерного профилирования текста с учетом разнообразных языковых и экстралингвистических характеристик.
Как известно, социальные роли, в том и числе гендерные, тесно связаны с речевыми особенностями человека. В речи отражается также социальный статус (профессия, уровень культуры, в том числе и речевой), являющийся более постоянным индикатором и составляющим социального «портрета» личности. Человек, являясь частью различных социальных объединений, выполняет разнообразные социальные роли, определяющие выбор используемых языковых средств [8]. С другой стороны, выполняя одну и ту же социальную роль, разные люди в силу имеющихся уровней речевой культуры, выразительности, психологических и других особенностей будут писать по-разному.
На характеристику речевого поведения могут оказывать влияние внутренние и внешние факторы, например эмоционально окрашенный стиль письменной речи проявляется в больших отступлениях от лексических и синтаксических норм, в увеличении количества ошибок и описок [12]. Индивидуальность в отношении письменной речи характеризуется наличием определенных показателей, а также спецификой речевых навыков конкретного человека, проявляющейся в уровне его интеллекта, характеристике его профессиональных и жизненных интересов, особенностей словарного запаса, стилистических конструкций, наличием типичных слов и выражений [12].
В связи с этим одна из идей профилирования текста связывается нами с социолингвистической переменной – «величиной, которая зависит от некоторой нелингвистической переменной социального контекста: говорящего, слушающего, аудитории, обстановки и т. п.» [11, с. 150]. Лингвистические признаки, которые У. Лабов называет индикаторами, «образуют регулярное распределение по общественно-экономическим, этническим или возрастным группам, но в речи каждого индивидуума проявляются более или менее одинаковым образом в любом контексте» [9].
Е.И. Горошко, обобщая результаты исследований западных ученых по данной теме, отмечает, что в список стилеметрических показателей входят: 1) распределение частоты длины слов, 2) среднее количество слогов в словоформах, 3) длина слогов, 4) среднее количество словоформ в предложении, 5) особенности распределения частеречной принадлежности слов от их позиции в предложении, 6) число служебных слов, 7) индексы лексического разнообразия и показатель величины энтропии текста, а также 8) показатели лексической дистрибуции [3] . Особого внимания заслуживает статистический анализ тех признаков письменной речи, наличие которых не зависит от содержания текста. Полагаем, что все приведенные исследователем параметры относятся именно к таким признакам.
Е.И. Горошко провела также собственные исследования на материале русского языка и выявила следующие закономерности: словарь женщин по показателю лексического разнообразия оказался беднее, в речи мужчин было больше слов с час- тотой один и два, в остальных показателях не было выявлено значительных различий [3].
Из сказанного следует, что проблема моделирования языковой личности автора письменного текста может решаться на различных теоретических основаниях. Вместе с тем в контексте лингвистической и автороведческой экспертизы текстов она по определению должна переходить из области теоретических построений в плоскость практических решений. Подобная облигаторность напоминает деятельность лексикографа, вынужденного принимать практические решения в далеко не однозначных теоретических областях, таких как разграничение полисемии и омонимии, кон-версивных пар «существительное – глагол», например, в английском языке, коллокаций, которые подаются, как правило, внутри зоны значений, и идиом, представляемых в отдельной, «заромбо-вой» в русской словарной традиции, зоне.
Полагаем, что гендерное профилирование субстандартного текста должно исходить из следующих теоретико-практических предположений.
-
1. Определение гендерных особенностей текста, в том числе и субстандартного, исходит из тех же предпосылок, что и атрибуция текста, поскольку при определении авторства имеет место опора на текст как проекцию языковой личности автора на текстовые параметры.
-
2. Из всего разнообразия текстовых параметров выбираются те, которые в минимальной степени способны контролироваться автором. Набор параметров опирается на идеи стилеметрии Н.А. Морозова [13], работы по установлению авторства «Тихого Дона» [14], по автороведческой экспертизе в современной лингвоюридической практике [7].
-
3. Нами предлагается оптимальное, как видится на настоящее время, сочетание текстовых параметров, слабо контролируемых автором, и программного компьютерного инструментария, способного обеспечить относительную объективность анализа большого массива данных и высокую производительность такого анализа. Использование современных компьютерных программ, дающих возможность осуществлять достоверный и эффективный анализ значительного количества данных, можно считать значительным шагом в совершенствовании инструментария атрибуции текста в автороведческой экспертизе.
Мы предлагаем проводить процедуру гендерного профилирования текста по следующим параметрам:
-
• лексическим (средняя длина слова, длина слова в слогах, индекс лексического разнообразия);
-
• морфологическим (частеречный состав исследуемых текстов);
-
• синтаксическим (длина предложения, позиция частей речи в предложении, тип предложений – простое, сложносочиненное, сложноподчиненное, сложное с разными видами связи);
-
• стилистическим (комплексные характеристики, представляющие стиль автора как целое и
- идентифицирующие его в том или ином отношении – например инвариант Фоменко);
-
• фоносемантическим (подсознательное восприятие звуковой стороны текста) [7]. На стыке плана содержания и плана выражения находится отрасль языкознания, призванная исследовать звукоизобразительную (звукоподражательную, звукосимволическую) систему языка [2]. Значение звуков может быть описано с помощью шкал, включающих в себя прилагательные, относящиеся к понятиям различного порядка и формирующие субъективные семантические пространства;
-
• эрративным (устанавливающим типичные ошибки или отсутствие таковых, а также уникальные ошибки).
-
5. Сведение полученных результатов в единый «координационный» блок, в котором проводится «взвешивание» получаемых данных и их ранжирование. Сначала ранжируются данные для «типичного» мужского и «типичного» женского
Данные для анализа могут быть получены с помощью такого компьютерного инструментария, как программа «Худломер», стандартной программы Microsoft Word (сервис «Статистика»), сайта Мультитран, программ Style Recognition System, «Лингвоанализатор», «Сервис анализа текстов и сайтов» и других [7] Существуют также специальные компьютерные программы, с помощью которых возможно провести фоносемантический анализ текста. К ним относятся ВААЛ, DIATON и другие, в основу работы которых положены исследования Ч. Осгуда, алгоритмы А.П. Журавлева [4] и В.В. Левицкого [10]. Как утверждают разработчики, данные программы позволяют определить фоносемантические характеристики слова и текста, типы кодирования, звуко-цветовые ассоциации, связанные с текстом, ритмические характеристики текста, «золотое сечение» текста.
Ввиду того что программы используют различные алгоритмы, которые основываются на тех или иных теориях, в исследовании следует применять разные программные средства там, где это возможно, с целью минимизации погрешностей получения результатов профилирования. Анализ величины, характеризующей степень разброса количественных значений показателей статистической выборки (случайных величин) относительно среднего значения для этой выборки, может служить идентификационным фактором для определения гендерной принадлежности текста. Однако остается не установленным точно, какая именно величина является значимой в данном случае.
Комбинация объективного (в той мере, насколько это обеспечивается теоретическими основаниями и алгоритмами, положенными в основу программ) статистического компьютерного анализа и исследование малоконтролируемых индикаторов позволяют считать предлагаемую методику весьма эффективной и лишенной, насколько это возможно, субъективности. Мы полагаем, что данный подход к анализу текста может быть успешно использован и для неидентификационного исследования.
Красса С.И., Калугина Е.Н.
текстов. Чем больше текстов будет проанализировано, тем надежнее окажутся полученные результаты. Затем анализируются результаты для нормативных и субстандартных текстов.
Таким образом, в поставленной проблеме гендерного профилирования субстандартного текста насущными задачами являются следующие:
-
1. Создание концепции комплекса компьютерных программ, помогающих в решении установления авторского профиля текста.
-
2. Разработка или модификация программного обеспечения лексического, морфологического, синтаксического и стилистического модулей, а также координационного блока.
-
3. Проведение экспериментов по выявлению величины различия в параметрах, свидетельствующих в пользу мужского или женского авторства.
-
4. Формирование расширенного списка параметров и их ранжирование с целью профилирования автора текста.
В заключение отметим, что получение гендерного профиля автора субстандартного текста возможно в три этапа. На первом этапе определяется методика анализа и возможные программные средства, пригодные для этого. По существу, этот этап ничем не отличается от определения авторства, т.е. процедуры атрибуции текста. Затем атрибуция текста сужается до актуализации параметров, характерных для различия автора по полу. Подобное достигается путем многократного анализа текстов с известным по полу авторством. Наконец, на третьем, заключительном, этапе происходит еще одно сужение – на материале субстандартных текстов. Следует признать, что построение профиля автора субстандартного текста может быть проведено и на втором этапе – тогда у исследователя будут в распоряжении отличия профиля от литературной нормы. И затем уже проводится сужение до различий автора по полу. Однако порядок в получении спецификации «гендер / субстандарт» не окажет, по нашему мнению, существенного влияния на итоговые результаты.
Список литературы Гендерное профилирование автора субстандартного текста
- Авторский инвариант. -http://ru.wikipedia.org/wiki/Авторский инвариант (дата обращения 5.04.2014).
- Воронин, С.В. Основы фоносемантики/С.В. Воронин. -Изд. 2-е. -М.: ЛЕНАНД, 2006. -248 с.
- Горошко, Е.И. Изучение электронного дискурса в судебном речеведении/Е.И. Горошко http://www.textology.ru/article.aspx?aId=44 (дата обращения 07.04.2014).
- Журавлев, А.П. Звук и смысл/А.П. Журавлев. -2-е изд. -М.: Просвещение, 1991. -160 с.
- Йокояма, О.Б. Когнитивный статус гендерных различий в языке и их когнитивное моделирование/О.Б. Йокояма//Wiener Slawistischer Almanach, Munchen, Sonderband 55 (2002) X-XX. -С. 29-40.
- Каменская, О.Л. Гендергетика -междисциплинарная наука/О.Л. Каменская//Тезисы докладов Второй международной конференции «Гендер: язык, культура, коммуникация», МГЛУ, Москва, 22-23 ноября 2001 г. -М.: МГЛУ, 2001. -С. 62-63.
- Красса, С.И. Методика и инструментарий атрибуции текста в автороведческой экспертизе С.И. Красса//Альманах современной науки и образования. -2013. -№ 10 (7). -С. 106-108.
- Красса, С.И. Гендерные лингвоконцентры субстандарта/С.И. Красса, Е.Н. Калугина//Вестник ЮУрГУ. Серия «Лингвистика». -2012. -№ 25. -С. 27-31.
- Лабов, У. Исследование языка в его социальном контексте/У. Лабов//Новое в лингвистике. Вып. VII. Социолингвистика. -М.: Прогресс, 1975. -С. 5-33.
- Левицкий, В.В. Фонетическая мотивированность слова/В.В. Левицкий//Вопросы языкознания. -№ 1. -1994. -С. 26-37.
- Литвинова, Т.А. Лингвистические основы неидентификационной судебно-автороведческой экспертизы/Т.А. Литвинова//Вестник Челябинского государственного университета. -2012. -№ 20 (274). -Филология. Искусствоведение. -Вып. 67. -С. 74-78.
- Морозов, Б.Н. Особенности криминалистического исследования письменной речи/Б.Н. Морозов. -Ташкент, 1985. -40 с.
- Морозов, Н.А. Лингвистические спектры/Н.А. Морозов. -http://www.textology.ru/library/book.aspx?bookId=1&textId=3 (дата обращения 11.04.2014).
- Кто написал «Тихий Дон»? (Проблема авторства «Тихого Дона»)/Г. Хьетсо, С. Густавссон, Б. Бекман, С. Гил. -М.: Книга, 1989. -263 с.