Научные статьи \ Общие вопросы науки и культуры \ Информационные технологии. Вычислительная техника. Обработка данных \ Прикладные информационные (компьютерные) технологии. Методы основанные на применении компьютеров

Картины мира и информационная герменевтика

Автор: Кордонский Симон Гдальевич, Бардин Валерий Владимирович

Журнал: Телескоп: журнал социологических и маркетинговых исследований @teleskop

Рубрика: Методология и методы

Статья в выпуске: 3, 2018 года.

Бесплатный доступ

В данной статье авторы рассматривают проблемы, связанные с противоречивостью интерпретаций понятия «картины мира» в философии, информатике и предметных областях знания. Авторы демонстрируют необходимость операционализа-ции этого понятия в связи с технологическими проблемами организации информации, анализа текстов и выявления смыслов в ходе поиска информации в информационном пространстве. Авторы предлагают использовать для действий в информационном пространстве технологию веерных матриц, частично реализованную в системе анализа текстов «Гитика».

Картины мира, герменевтика, веерные матрицы, информатика, философские онтологии, предметные онтологии, информационные онтологии

Короткий адрес: https://sciup.org/142222936

IDR: 142222936

Текст научной статьи Картины мира и информационная герменевтика

Системный программист, идеолог и организатор создания Рунет, Национальной службы новостей (НСН), Интегрум, и др. известных проектов.

Лауреат премии Правительства СССР (1988 г)

Термин «картины мира» сегодня носит скорее аллегорический характер, чем научный. Ни одна область знания, кроме философии, не имеет картины мира своим предметом, но каждая область знания и практики, и философия в том числе, выстраивает тем или иным образом свою картину мира.

У специалистов, как правило, есть общее представление о структуре своей предметной области, о том, что в ней существует и как существующее функционирует. Этих общих представлений обычно хватает, чтобы определять примерные границы предметной области, утверждая что вот это — «не физика», это «не философия» или это «вообще не наука». При этом внутри любой области знания есть мировозренческие нюансы, такие, например, как вековая дискуссия между философствующими физиками о том, что такое физическая картина мира.

Такие представления пунктирно ограничивают предметные области практики и знания от профанации, но не с той степенью строгости, которая бы позволила их непротиворечиво описать. Ни одна область знания не свободна от внутренних конфликтов и противоречий, связанных с различиями в понимании того, что в предметной области существует и как оно сопряжено с другими сущностями этой же и иных областей.

У разного рода гуманитариев и обывателей и такого пунктирного ограничения нет, и философы, культурологи, специалисты СМИ, режиссеры, сценаристы и пр. создают новые —искусственные —картины мира, обогащающие информационное пространство, но не прибавляющие ему прозрачности1.

***

Индивидуальные и коллективные картины мира, их содержательная уникальность и неограниченная множественность традиционно являются предметом философствования. Многие философы пытались «навести порядок» и построить универсальную картину мира или создать логики, которые бы порождали эти картины. Однако оказалось, что для решения задачи недостаточно быть интерпретатором трудов Ясперса, Хайдеггера, Гадамера, Гуссерля и т.д, так как интерпретации не меняют ситуации в целом, лишь обогащая информационное пространство философскими картинами, включающими в себя философски осмысленные результаты современных лингвистических, физических, генетических, и пр. исследований —по случаю и усмотрению интерпретатора.

Трудами обывателей и профессиональных философов, а также философствующих теологов, физиков, математиков, историков, филологов и многих других воспроизводится множество конфликтующих картин мира, каждая из которых имеет апологетов, объединенных в конфессии, секты, партии, научные школы и движения и находящихся в весьма непростых отношениях виртуальной, а иногда и вполне реальной конкуренции за право представлять «единственно верное» мировоззрение.

***

Так что же все такое, эти самые картины мира? Википедия определяет их следующим образом:

Картина мира: «

• целиком определяет специфический способ восприятия и интерпретации событий и явлений;
• представляет собой основу, фундамент мировосприятия, опираясь на который человек действует в мире;
• имеет исторически обусловленный характер, что предполагает постоянные изменения картины мира всех её субъектов» (см продолжение определения в приложении).

Приведенные тексты трудно называть определениями понятия, они демонстрируют характерную не только для википедии разномасштабность интерпретаций термина и его философскую неопределенность, не позволяющие его хоть как-то операционализировать. Ситуация в общем распространенная: термин есть, а понятия и его определения нет.

С другой стороны, а зачем, собственно, пытаться определить понятие и наполнить содержанием уже привычный термин? Проблемы с операционализацией понятия картины мира, судя по отсутствию дискуссий на эту тему, не существует ни в философии, ни в современной науке, ни в социальной практике. Надо просто принять, что картины мира есть, что они разные, и отношения между ними столь сложны, что даже не стоит заниматься их описанием и анализом. Ведь картина мира, как написано в википедийном определении, это почти то же самое, что и культура, и парадигма (или парадигма с культурой вместе), с определениями которых, как известно, возникают похожие трудности.

Однако необходимость операционализации этого понятия возникла в информатике, специфика которой, в частности, состоит в том, что почти все картины мира, существующие в виде текстов, включены в глобальное информационное прост- ранство. Результаты научной, культурной, экономической, политической и технологической деятельностей зачастую возникают сразу в «электронной форме» и только в ней существуют, или переводятся в нее. Причем темпы этого процесса таковы, что если текст не представлен в электронной форме, то вероятность того, что он выпадет из социального оборота весьма велика. Он просто перестает быть доступным, перестает существовать.

В науке, философии, быту и пр. картины мира сопряжены с социальными, профессиональными и иными группами и воспроизводятся этими группами, даже если эти картины не представлены текстами. Но в информационное пространство люди и социальные группы проецируются именно своими картинами мира в виде текстов и образов и только в таком виде в нем существуют. Эти тексты и образы, как правило, относительно «самостоятельны» и тем или иным образом отделены от того социального субстрата, который их породил и в связи с которым они были предметно определены2.

Для того, чтобы сопоставить текст или совокупность текстов с социальными группами, с отношениями между ними, определить географическую и временную привязку действий, описанных в текстах, надо решить «обратную задачу» и определить, основываясь на тексте или их совокупности, какая социальная группа и в какой пространственной и временной ситуация представлена в этих текстах. Именно для решения таких «обратных задач» и формируются информационные технологии, ведь информация значима не сама по себе, но в привязке к тому социальному (экономическому, инженерному, научному) феномену, который она описывает. Современные информационные технологии работают достаточно эффективно и надежно в том случае, когда исходно такая привязка есть, то есть известно, к какой социальной или иной ситуации анализируемый текст относится.

Проблемы возникают тогда, когда привязка к социальному субстрату отсутствует или неоднозначна. Ведь подавляющее количество текстов может соотносится с принципиально разными картинами мира и социальными группами и, следовательно, могут пониматься по разному.

Возьмем, например, текст, в котором есть слово онтология. Термин «онтология» имеет два не пересекающихся значения, философское и информационное. В философии термин сопряжен с проблематикой трудов известных философов и их последователей, интерпретаторов и критиков. А в тексте по информатике термин интерпретируется как в той или иной степени формализованный список сущностей выбранной области знания и практики и соотносится с разнообразными системами классификации и стандартизации предметных сущностей. Философские картины мира и картина мира информатики если и пересекаются, то только в термине «онтология».

В жизни философ с лету определит, что некая совокупность текстов не имеет отношения к философии, хотя в ней и используется термин онтология. Равно и специалист по информатике даже не прикоснется к философскому тексту, хотя в нем используется привычный ему термин. Но разделить (имеющими программными методами) совокупность текстов, которые выдают поисковые алгоритмы на запрос «онтология» на собственно философские тексты и тексты по информатике весьма сложно.

Информационное пространство можно рассматривать как совокупность разнородных картин мира, представленных в текстовой, визуальной, звуковой формах, и отношений между ними. Картины мира в силу особенностей их представления, их контекстов, смешаны, переплетены друг с другом, переходят из одной в другую так, что различить существующими метода- ми более—менее строгое (научное, техническое, экономическое) знание, бытовое знание и разного рода философствования на произвольную тему весьма сложно. Для этого необходим специальный инструментарий, позволяющий сепарировать информационное пространство, вычленять из него отдельные картины мира и записывать их в такой форме, которая не зависит от произвола исследователя. Такого инструментария сегодня нет.

Кроме того, для того чтобы понять, к какой предметной области, описанию социальной группы или ситуации относится термин в выбранной совокупности текстов, необходимо знать контекст, то есть, например, во взятом случае онтологий отделить философское от информационного. Для этого необходимо научиться выделять контексты.

Проблема извлечения контекста жестко связана с пониманием текстов. Проблема понимания традиционно является предметом философской герменевтики, выработавшей не очень четкие, но глубокие представления о том, что такое понимание. Согласно Гадамеру, например, понимание возможно как соотнесение содержания текста и культурного опыта современности. Интерпретация текста состоит, таким образом, не в воссоздании первичного, авторского смысла текста, а в создании смысла. Тексты, как считают герменевтики, пишутся заново в момент их чтения и интерпретации. «Интерпретация выступает как некий предварительный этап и как условие понимания, а само понимание —как результат интерпретации. Поскольку тот, кто понимает, изначально вовлечен внутрь того, что понимается, постольку оказывается невозможно провести четкую границу между пониманием и интерпретацией. Чтобы нечто понять, его нужно истолковать, но чтобы его истолковывать, нужно уже обладать его пониманием, то есть неким предпониманием. Разомкнуть герменетический круг оказывается невозможно, поскольку невозможно оказывается полное и адекватное понимание. Причем, цель понимания и цель интерпретации состоит не в «воспроизведении», а в «произведении» смысла»3.

В переводе с философского языка на язык информатики, написанное означает, что необходимым (но не достаточным) условием для понимания является совпадение (или пересечение) контекстов пишущего и читающего человека. Для того чтобы понимать текст, необходимо знать, к какой картине мире этот текст относится. В ином случае контекст не извлекаем, текст остается не понятым.

Современные методы лингвистического и статистического анализа текстов ориентированы на «лобовое» решение задач различения картин мира и извлечения контекстов, основанное на развитии алгоритмов анализа текстов, техники вычислений и росте вычислительных мощностей и объемов обрабатываемых текстов. При таком подходе предполагается, что алгоритмизированное знание о структуре языка, на котором написаны тексты, в сочетании с изощренными методами статистического анализа достаточны для того, чтобы извлекать контексты и описывать картины мира с необходимой для пользователя точностью.

Неадекватность такого «лобового» подхода к задачам и для специалиста, и для обывателя, имеющих доступ в «мировую паутину», проявляются как информационный шум в ответе на поисковый запрос, в непреодолимых трудностях разделения фактической информации от интерпретационной, в громоздкости и слабой эффективности инструментов для разделения, например, политических, бытовых, технологических и иных аспектов изучаемого феномена.

«Всемирная паутина» без технологических возможностей для соотнесения текста и их совокупности с породившими их социальными субстратами так и останется помойкой, куда сбрасываются результаты труда пишущих людей и которую сейчас пытаются разгребать специалисты по информатике, статистики и лингвисты специально для этого разработанными, но не очень функциональными инструментами. Вероятно, необходимый для решения проблемы инструментарий должна предоставлять философия. Однако ждать от современной философии чего-то более инструментального, чем кружевные построения герменевтиков, не приходиться.

***

Тем не менее, именно при реализации «лобового» подхода возникли современные инструменты работы в информационном пространстве, такие как сетевые энциклопедии, базы данных и знаний, тезаурусы и семантические пространства, кластеризация, и многие другие.

Однако пока ни одна из этих технологий, ни по отдельности, ни вместе взятые не позволяют получить ответы на само собой разумеющиеся при содержательном анализе вопросы, такие как:

— к какой картине мира может быть отнесен произвольно выбранный текст?
— как построить картину (картины) мира по корпусу текстов?
— как сравнивать две картины мира?
— какие контексты имеются в произвольно выбранном тексте? Какие контексты вообще бывают? Как их можно обобщить и представить в виде картин мира (научных, религиозных, конспирологических, магических)?

— как разделять картины мира и записывать знания, учитывая их разную интерпретацию в разных картинах мира?

— как убедится, что полученный текст не несет новых знаний, относительно известной картины мира?

— какие картины мира нужно привлечь, чтобы правильно интерпретировать данный текст?

— как научиться рассматривать постоянно приумножающиеся объемы текстов с точки зрения появления новых картин мира, или расширения известных?

Для ответов на такие вопросы необходимо, прежде всего, операционализировать само понятие картины мира, то есть задать его в терминах, которые можно применять в информатике.

***

Определим картины мира как с овокупность явных и скрытых представлений о том:

— что существует,

— как элементы сущего связаны между собой,

— почему существует то, что существует, а связи между сущим таковы, какие они есть.

Отвечая на вопрос «что существует в данной картине мира?» специалисты по информатике используют понятие онтологий, отбрасывая его философский контекст. В результате онтологии в информатике представлены, как уже подчеркивалось, как в той или иной степени упорядоченные списки того, что, по мнению разработчиков, существует в той предметной области, для которой онтология создается. И если для областей практики, материальная и иная основа которых целиком являются результатом человеческой деятельности (техника и технологии, прежде всего) такой подход как-то себя оправдывает, то для естественных и культурных картин его применение, как показывает опыт, не функционально.

В роли онтологий (упорядоченных представлений о существующем) выступают еще и многочисленные базы данных и знаний, в которых тем или иным образом сведены представления о сущем. Но... проклассифицировав и выявив все статисти- чески и лингвистически значимые связи между элементами текстов, используя базы знаний и данных, все-таки невозможно понять, какая это картина мира, чья она, что в ней существует, и чего в этой картине мире нет и быть не может. Именно поэтому в современных технологиях работы с информацией так важна роль эксперта, который, основываясь на своей картине мира, диагностирует результаты лингвистических и статистических исследований текстов как осмысленные, или не очень осмысленные. В деятельности эксперта-интерпретатора результаты лингво-статистических исследований получают смысл. Но далеко не факт, что это именно тот смысл, который был свойственен исходным текстам.

При построении онтологий в информатике доминирует идея потенциальной возможности построения одной всеобъемлющей картины мира, включающей в себя все и вся —в виде списка сущностей. При этом актуальное многообразие картин мира никак не укладывается в представления специалистов по информатике, искренне считающих, что есть одна истинно верная картина мира с ее единственно верной онтологией, а именно та, которую они считают само собой разумеющейся. И в этом специалисты по информатике не одиноки, ведь философствующие математики, физики, биологи, теологи и др., как правило, претендуют на то, что именно их картина мира единственно возможная и пытаются свести феномены всех картин мира к своей, единственно им понятной, но трудно объяснимой другим специалистам в силу, как принято считать в почти каждом профессиональном круге, их умственной ограниченности.

Отвечая на вопрос, «какие связи существуют между феноменами предметной области, представленными в текстах », специалисты по информатике привлекают мощный аппарат лингвистики, семиотики и статистические методы, получая вполне приемлемые результаты —если не учитывать того, что эти результаты далеко не просто соотнести с тем, что в предметной области признается существующим, какая картина мира представлена в этом тексте. Более того, определить то, к какой предметной области относится текст и, следовательно, с чем существующее в этой предметной области связано, используя только методы лингво-статистического анализа вряд ли возможно в принципе.

И именно этот разрыв между социальной реальностью и обработанным лингво-статистическими методами содержанием информационного пространства заполняют упомянутые выше эксперты-аналитики со своими мировоззрениями, по определению ограниченными и акцентуированными. Эксперты и аналитики связывают обработанные тексты из информационного пространства с элементами социальной реальности, при этом их предметная компетентность часто такова, что обессмысливает результаты применения самых изощренных методов лингвистики и статистики. В предельном случае, эксперты и аналитики используют современные методы анализа текстов только для иллюстрации своих интуиций или для обоснования ангажированных выводов и заключений.

***

С нашей точки зрения, картина мира современной информатики, как и многих других областей знания, ущербна в том смысле, что в ней нет понимания неполноты собственных методов, как и понимания того, что механическое заимствование философских понятий не прибавляет ей инструментальности. Представляется, что термину онтология в информатике должен быть соотнесен собственно философский контекст.

Лингвистические и статистические методы работы с содержанием информационного пространства должны быть дополнены собственно философскими методами, доведенными до такого уровня технологичности, чтобы они стали совместимыми с методами и понятийными аппаратами лингвистики и статистики. И если в результате возникнет прозрачная логика, в которой возможно получение ответа на вопрос «что существует в этой предметной области?», то уже отработанные технологии ответа на вопрос «как связаны существующие феномены?» позволят решать многие проблемы работы с содержанием информационного пространства с гораздо меньшими издержками. Более того, ответы на вопросы «что существует» и «как существующее функционирует» позволит ограничить сегодняшний произвол экспертов и аналитиков в ответах на вопрос «почему существует то, что существует и почему есть такие, а не иные связи между элементами сущего».

***

Разработка такой логики, философской по своей природе, но ориентированной на задачи работы с содержанием информационного пространства, может стать предметом особой области знания, которую мы назвали информационной герменевтикой . Эта область знания формируется сейчас и уже программно реализована как часть системы анализа текстов ГИТИ-КА, элементы которой защищены патентами России и США⁴.

Объектом исследования информационной герменевтики является содержание информационного пространства. Предметом исследования —картины мира. Методом информационной герменевтики являются веерные матрицы. Результатом применения методов информационной герменевтики становится формирование онтологий картин мира.

Аппарат веерных матриц предназначен для ответа на вопрос, что существует в данной картине мира, что это за картина мира, как она называется и как соотносится —в онтологическом плане —с другими картинами мира. Веерные матрицы позволяют технологизировать задачи выделения контекстов и последовательно, в одной и той же логике, упорядочивать онтологические элементы картин мира, делая предположения о том, что в этой картине мира может еще существовать и проверяя эти предположения. Кроме того, логика веерных матриц позволяет выстраивать формальные связи между разными картинами мира, сравнивать их как по наличию —отсутствию элементов, так по отношениям между ними. Иными словами, веерные матрицы представляют собой технологию, позволяющую выстраивать упорядоченные по определенной логике списки сущностей, с которыми уже можно работать традиционными лингвистическими и статистическими методами и отвечать на вопросы о том, как связаны элементы сущего.

Применение веерных матриц (то есть извлечение сущностей по формальным правилам) итеративно и осуществляется в логике расширения герменевтического круга, то есть в соответствии с традицией философской герменевтики, хотя принципиально отличается от практики традиционных философских построений.

Основным свойством картин мира, используемых в ГИТИ-КЕ, является единообразие в логике их построения. Причем единообразие логик построения реализуется таким образом, чтобы сохранялись предметные (содержательные) понятия, специфизирующие взятую картину мира. Это означает, что логика построения картин мира физики и психологии, например, должна быть одной и что все эти картины мира являются частями одной —научной —картины.

В ходе работы выяснилось, что на основе одного и того же набора элементов можно построить множество картин мира, отличающиеся только правилами построения. Картины мира, объединенные последовательным применением единых правил построения их онтологий, считаются принадлежащими к одному пространству онтологий. Количество таких прост- ранств внешним образом не ограничено, то есть не существует единой всеобъемлющей картины мира и теоретической онтологии.

Сопряженное использование герменевтических, статистических и лингвистических методов уже сейчас позволяет отвечать на такие вопросы как:

— имеют ли картины мира общие онтологические элементы, похожи ли они друг на друга и в каком отношении, насколько они близки друг к другу или, наоборот —ортогональны.

— описывать картины мира, эксплицировать их онтологии и определять как «близкие», «далекие», «высокого уровня» и пр.

— определять, в каких онтологиях какой картины мира написан текст.

— определять то, как изменения онтологии модифицируют данный текст.

— определять позиции наблюдателя в данном пространстве онтологий.

— выяснять, о каких объектах, связях, событиях и процессах в этих онтологий идет речь.

Таким образом, методы информационной герменевтики дополняют традиционные методы лингвистического и статистического анализа содержания информационного пространства и позволяют гораздо более эффективно отвечать на вопросы о том, что существует в данной картине мире, как связаны элементы картин мира и почему именно так, а не иначе.

Список литературы Картины мира и информационная герменевтика

Кордонский С.Г. Циклы деятельности и идеальные объекты. М., 2001.
Кордонский С.Г. Рынки власти. Москва. 2000 Кордонский СГ. Сословная структура постсоветской России. М. 2008
Кордонский С.Г. Поместная федерация. М 2010
Кордонский С., Бардин В. «О поиске информации в совокупности текстов, отображающих картины мира». Вашингтон, Русгенпро-ект, 2010 ISBN: 9780984422708
Кордонский С. Г. Веерные матрицы как инструмент построения онтологий Washington DC: Юго-Восток, 2011
С. Кордонский, В. Бардин Прикладная герменевтика информационного пространства (картины мира, теоретические онтологии и веерные матрицы). Логос. М. 2014 (в печати)
Daya C.Wimalasuriya, Dejing Dou. Ontology-based information extraction: An introduction and a survey of current approaches. Journal of Information Science, Volume 36 Issue 3, June 2010
B. Adrian, G. Neumann, A. Troussov and B. Popov, Proceedings of the First International and KI-08 Workshop on Ontology-Based Information Extraction Systems (DFKI, Kaiserslautern, Germany, 2008).
F. Wu, R. Hoffmann and D.S. Weld, Information extraction from Wikipedia: moving down the long tail. In: Proceedings of the 14th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (ACM, New York, 2008).
Х-Г Гадамер «Истина и Метод» Основы философской герменевтики. Москва, "Прогресс" 1988

Еще