Искусственный интеллект как инструмент анализа литературных текстов
Автор: Белова О.В., Чернова С.В.
Журнал: Инфокоммуникационные технологии @ikt-psuti
Рубрика: Новые информационные технологии
Статья в выпуске: 2 т.20, 2022 года.
Бесплатный доступ
На сегодняшний день актуализируется вопрос интеграции технологии искусственного интеллекта при решении различного рода задач. Одним из наиболее перспективных направлений использования интеллектуальных систем является анализ текстов. Данная статья посвящена актуальной теме, связанной с интеграцией искусственного интеллекта в качестве инструмента для анализа литературных текстов. Авторами используются теоретические и эмпирические методы исследования. С целью получения наиболее актуальной и объективной информации в статье использованы научные материалы отечественного и зарубежного авторства. Преимущественная часть работы посвящена именно вопросу применения технологии искусственного интеллекта при анализе текстов.
Скусственный интеллект, анализ, литература, информационные технологии, лингвист
Короткий адрес: https://sciup.org/140297114
IDR: 140297114 | DOI: 10.18469/ikt.2022.20.2.08
Текст научной статьи Искусственный интеллект как инструмент анализа литературных текстов
В рамках современного технологического прогресса особую актуальность получает развитие различного рода цифровых и информационных технологий (ИТ). Именно посредством данных технологий на сегодняшний день достигается и обеспечиваются высокая эффективность и рациональность использования ресурсов предприятия, а также разрабатываются инновационные решения, используемые не только в профессиональной сфере жизнедеятельности человека, но и в бытовой. Таким образом, в современном мире прослеживается достаточно интенсивная динамика интеграции в повседневной жизни людей цифровых технологий, которые, в свою очередь, позволяют автоматизировать те или иные процессы, а также упростить жизнь человека в целом. Современные разработки из сферы ИТ экономят время, трудовые ресурсы и выполняют рутинные задачи без использования человеческих рук [1; 7; 18].
Искусственный интеллект (ИИ) предоставляет современным компьютерам возможность к самообучению посредством накапливаемого опыта, адаптируясь при этом к задаваемым параметрам и выполняя задачи, которые раньше были доступны только человеку. В большей части разработки интеллектуальных средств заложена возможность глубокого обучения и обработки естественного языка. Посредством данных технологий появляется возможность обучения современных компьютеров для выполнения тех или иных задач, в основе чего заложены обработка большого объема данных и выявление в них закономерностей.
В целом необходимо отметить, что термин «искусственный интеллект» появился еще в 1956 году, однако текущую популярность интеллектуальные технологии получили лишь сегодня ввиду увеличения объемов данных и модернизации алгоритмов, оптимизации вычислительных мощностей и средств хранения данных [10; 14].
Анализ литературных текстов
Одним из наиболее актуальных, но при этом малоизученным направлением развития ИТ является использование технологии искусственного интеллекта (ИИ) для анализа литературных текстов. Данное направление представляет высокую актуальность при решении задач социогумани-тарного сектора современной науки [2].
Лингвисты в течение многих десятилетий производят изучение того, как именно устроен текст и предложения, являющиеся частями, из совокупности которых и складывается текст. По мере технологического прогресса происходила компьютеризация данного направления. Так, к примеру, группой американских лингвистов была выдвинута смелая идея под названием Джорджтаунский проект, смысл которой заключался в разработке автоматизированного процесса переводов текстов с одного языка на другой, используя при этом ресурсы электронно-вычислительных машин. Именно это явилось точкой отсчета для начала полномасштабных исследований в области компьютерного анализа текстов.
Помимо этого, интерес к такому виду анализа текста начинал появляться и с необходимостью достижения качественного компьютерного перевода. В течение нескольких лет проблема машинного перевода трансформировалась в отдельную научно-техническую проблему и фактически явилась в качестве отдельного научного направления. Наука компьютерного анализа текстов работает на стыках математики, кибернетики, лингвистики и, конечно же, программирования. Наряду с этим перед учеными стояла задача и создания полноценного искусственного интеллекта, посредством которого можно было бы повысить вычислительные мощности в исследованиях текстов.
Обработка естественного языка является общим направлением искусственного интеллекта и математической лингвистики. Это направление производит изучение проблем компьютерного анализа и синтеза естественных языков. В данном случае анализ представляет собой понимание языка, а синтез–генерацию грамотных текстов.
На теоретическом уровне создание естественно-языкового интерфейса для ЭВМ является очень перспективной целью. Необходимо отметить, что более ранние системы, работая с ограниченным набором данных, показывали достаточно хорошие результаты, вдохновляя этим других исследователей. Однако на практике данные системы столкнулись со сложностью и неоднозначностью реального мира [3].
Интеллектуальный анализ текста представляет собой процесс получения информации высокого качества на естественном языке. Зачастую для этой цели используется статическое обучение, основанное на шаблонах. Входной текст градируется с помощью шаблонов, и далее выполняется обработка полученных данных.
Необходимо отметить, что при анализе литературных текстов важно учитывать наличие возможных ошибок со стороны человека (опечатки, орфографические ошибки и другие). Ввиду наличия данных моментов понимание текста может быть значительно затруднено. Примером могут служить самые первые виртуальные собеседники, которые могли определить, является ли предложение вопросительным, только по наличию соответствующего пунктуационного знака, завершающего фразу. Однако, к сожалению, не всегда спонтанная письменная речь обладает идеальным уровнем грамотности, в связи с чем первое поколение виртуальных собеседников не могло претендовать даже на приближение к прохождению теста Тьюринга.
Роль искусственного интеллекта и машинного обучения ИИ включает в себя множество вычислительных возможностей для создания и анализа информации. Организации могут использовать ИИ и машинное обучение (МО) для распознавания закономерностей в данных и метаданных следующими способами. Обработка естественного языка сочетает в себе вычислительную лингвистику и другие методы извлечения смысла из текста. Алгоритмы прогнозирующего и предписывающего машинного обучения рассчитывают наилучшие действия для ответа на запросы, задачи или действия. Распознавание изображений анализирует шаблоны в изображениях или видео, чтобы различать объекты, сопоставляет шаблоны с доступной информацией и анализирует метаданные, чтобы определить, что содержат изображения или видео. Алгоритмы распознавания звука и речи анализируют волновые паттерны в аудиопотоках, чтобы определить слова, тон голоса, музыку и другие акустические характеристики. Хотя алгоритмы ИИ требуют сотрудников с опытом для их внедрения и обслуживания, эта технология не существует в вакууме. Вместо этого организации привязывают ИИ к предопределенным задачам и действиям, чтобы сэкономить время и усилия сотрудников [19].
Независимые поставщики программного обеспечения, начиная от отраслевых приверженцев и заканчивая стартапами, встраивают возможности ИИ в свои инструменты. Они объединяют определенные алгоритмы в микросервисы, делая эти сервисы доступными через API, и полагаются на облачные подключения для управления потоками контента. Чтобы разрабатывать приложения на основе контента, организации должны сосредоточиться на интеграции приложений. ИИ направлен на создание бизнес-приложений следующего поколения с микросервисами и API, подключенными через облачные среды к внутренним репозиториям контента – архитектуре на основе MACH. Эта архитектура может упростить интеграцию ИИ в потоки контента из разрозненных источников, таких как приложения, и в объединение метаданных.
На сегодняшний день существует множество экспериментальных разработок и ряд уже функционирующих при решении реальных задач программ, интеллектуально обрабатывающих литературные произведения. Так, к примеру, множество экспериментов из данной области было сделано в эпоху GOFAI («старый-добрый» искусственный интеллект). Работающая на символьном уровне интеллектуальная программа анализировала текст, воспринимая его как некоторую организованную структуру, которая может быть описана рядом правил. Данного рода модели ос- новывались на базе анализа синтаксиса, а также словарях, которые, в свою очередь, содержали наборы используемых словесных форм и синтаксическую информацию по каждой из них. Такими параметрами являлись часть речи, род, число и другие. На начальном этапе исследования обработки текстов посредством искусственного интеллекта было создано множество реализаций программ, которые стали фундаментом для дальнейших исследований [12].
Разработки на основе искусственного интеллекта
Одной из наиболее перспективных программ из области создания искусственного интеллекта для анализа текстов стала разработка компании OpenAI GPT-3 от 2020 года, которая включала генеративную нейронную сеть, способную находить смысловые зависимости в тексте, а также генерировать собственный связный оригинальный текст на английском языке. Необходимо отметить, что текстом являлась не отдельная фраза, а целое развернутое высказывание [4].
На сегодняшний день активно разрабатывается автоматизированное программное обеспечение, основывающееся на работе алгоритмов ИИ, которое позволяет исследователям-гуманитариям решать широкий спектр задач, связанных с анализом представлений и отношения автора текста к реалиям, которым посвящено произведение [16].
Алгоритмы ИИ могут автоматизировать управление метаданными, чтобы читать документы, сканировать изображения, извлекать смысл из текста, распознавать объекты в цифровых активах и назначать контенту соответствующие категории. ИИ может позволить разработчикам приложений получать доступ к более актуальному контенту для создания более интеллектуальных приложений. Микроопыт ИИ может создавать микроопыты для автоматизации задач и действий. С помощью микроопыта с возможностью покупки контента клиенты могли покупать товары непосредственно в приложении без витрины или веб-сайта. Например, человек может увидеть свитер на фотографии, коснуться его и купить – и все это без посещения веб-сайта бренда. Точно так же писатели могут полагаться на инструменты поддержки написания, чтобы проверять орфографию и грамматику, получать советы по тону голоса, проверять терминологию бренда, проверять рекомендации по стилю и рекомендовать исправления.
ИИ может ускорить редакционные задачи, которые обычно выполняют корректоры и редакторы, и снизить производственные затраты. Умные процессы с MACH управлением контентом могут объединять контент из более разрозненных источников, а искусственный интеллект может сделать этот контент действенным. Даже с инновационными инструментами на базе искусственного интеллекта человеческое понимание имеет значение. Таким образом, группы обеспечения соответствия могут полагаться на ИИ для мониторинга и расшифровки больших коллекций документов, хранящихся в репозиториях контента [13; 20].
Команды по маркетингу могут автоматически проверять права на цифровые изображения, прежде чем утверждать их для распространения, добавлять на веб-сайты и включать в рекламные кампании. Однако организациям может быть сложно разработать интеллектуальные процессы, которые разделяют бизнес-задачи на задачи, объединяют контент из разрозненных источников и определяют, как алгоритмы ИИ могут улучшить работу. Кроме того, организации должны сосредоточиться на людях и на том, как они управляют процессами [8; 11].
В последние годы искусственный интеллект (ИИ) развивался беспрецедентными темпами, позволяя компаниям и частным лицам совершать невообразимые ранее достижения. Искусственный интеллект больше не является чужеродным научно-фантастическим понятием – теперь это неотъемлемая часть нашей повседневной жизни, помогающая нам различными способами. ИИ постепенно проникает в медиасектор, где начинает оказывать значительное влияние. Генераторы текста на основе ИИ неуклонно революционизируют создание контента, взаимодействие с пользователем, рабочие процессы с видео, SEO, цифровой маркетинг и ряд других областей. Например, New York Times и BBC одними из первых это заметили. Эти компании уже начали использовать ИИ в своих интересах. В первую очередь они применяют ИИ для автоматизации многочисленных монотонных процессов создания и публикации контента [15; 17].
Итак, давайте углубимся и изучим новый мир текстовых генераторов ИИ, что они собой представляют и какие из них являются лучшими в отрасли прямо сейчас. Что такое генератор текста AI? Генераторы текстов с искусственным интеллектом используют машинное обучение, чтобы помочь пользователям на многих этапах процесса написания, таких как исследование, проверка грамматики и тона, а также локализация. Любой, кто ищет помощь в написании текстов, от контент-маркетологов, стремящихся писать более интересный контент, до сотрудников отдела кадров, оптимизирующих объявления о вакансиях, может извлечь выгоду из расширенного письма. Инструменты используют обработку естественного языка (NLP) для оценки текста и создания рекомендаций или соответствующего контента. Эти технологии могут помочь пользователям создавать контент быстрее и увереннее, что обычно занимает много времени [9].
Масштабы и сложность текстовых генераторов ИИ чрезвычайно разнообразны. Некоторые из них представляют собой полноценные расширенные платформы для письма, где пользователи создают свой контент. Другие – более простые боты, которые потребляют контент из других источников и после этого дают рекомендации. Некоторые генераторы текста на основе ИИ обладают очень специфическими возможностями, такими как создание определенных типов форм или предоставление точных рекомендаций по написанию. Как работает генератор текста AI? Генератор текста AI – это текстовый редактор, использующий искусственный интеллект для создания красивого, убедительного и визуально привлекательного текста. С генератором текста на основе искусственного интеллекта вы можете с легкостью создавать профессионально выглядящие документы.
Кроме того, он имеет различные функции, которые делают его идеальным инструментом для ваших онлайн-письменных нужд. Например, AI Text Generator может автоматически генерировать заголовки, списки, таблицы и полосы. Вы также можете использовать генератор текста AI для создания заголовков и субтитров для вашего документа. И даже можете выбрать, чтобы текстовый редактор генерировал изображения специально для вашего документа. Генератор текста AI предлагает множество функций, которые делают его идеальным инструментом для ваших потребностей в онлайн-письме. Например, его простой в использовании интерфейс позволяет легко создавать профессионально выглядящие текстовые документы. Вы также можете использовать его многочисленные функции для улучшения качества ваших текстов. Например, генератор текста AI включает в себя текстовый процессор, анализатор грамматики и редактор контента.
Простой в использовании интерфейс позволяет с легкостью получать привлекательные и красивые текстовые документы. Используйте генератор текста AI для создания списка текста AI. Эти инструменты помогут вам сформировать автоматический текст, соответствующий поставленной вами задаче, и они будут очень эффективны в вашем письменном проекте.
-
1. Пишетсоник – Writesonic – это бесплатный текстовый онлайн-редактор, который упрощает создание, обмен и чтение цифровых текстов. Вы можете использовать Writesonic для написания статей, сообщений в блогах, эссе, книг или других типов документов. Вам не нужны какие-либо навыки или знания программирования, чтобы применять Writesonic; все, что вам нужно, – это подключение к Интернету и компьютер с интер-нет-браузером. Независимо от того, являетесь вы новичком или опытным писателем, Writesonic поможет вам легко начать работу. Вы можете использовать простой интерфейс редактора, чтобы сразу начать писать, или вы можете потратить некоторое время на чтение многочисленных руководств и примеров, чтобы узнать больше о том, как работает Writesonic.
-
2. Суммарайзер.org – Summarizer.org – это вебсайт, который позволяет пользователям создавать резюме любого текста, с которым они сталкиваются, будь то статьи, книги или просто общая информация. Сайт имеет простой в использовании интерфейс и предоставляет широкий спектр источников контента, которые помогут вам быстро и легко найти необходимую информацию. Вы также можете использовать Summarizer.org в качестве исследовательского инструмента, создавая собственные сводки по различным темам или людям в вашей жизни. Ищете ли вы быстрые идеи о том, что кто-то сказал, или хотите узнать больше по конкретной теме, Summarizer идеально подходит для этих задач.
-
3. Текстовый редактор First Draft расширяет свой искусственный интеллект с упором на конфиденциальность. Николь Миллер, писатель-ветеран с 15-летним стажем и разработчик First Draft, текстового редактора с искусственным интеллектом для Windows, предоставляет писателям три новых инструмента, облегчающих написание в безопасном и конфиденциальном режиме. Каждый инструмент учитывает потребность писателя в немедленных ответах на вопросы, необходимость формировать среду письма в индивидуальном порядке и необходимость доступа к личным данным – и все это без страха удаленного наблюдения или утечки данных. Например, функция «Быстрый вопрос» в First Draft отвечает на множество вопросов, которые могут
возникнуть у людей во время письма, например, как произнести фразу на иностранном языке или сколько дюймов в метре. Люди обычно обращаются к этим типам вопросов через поисковую систему. Но, используя искусственный интеллект для ответов на вопросы в автономном режиме, программное обеспечение не только снижает зависимость от поисковых систем, это дополнительно снижает риск отслеживания файлов cookie и непреднамеренного предоставления третьим лицам доступа к истории браузера.
Его Text Extractor, как еще один пример, действует как майнер личных данных, когда писателям нужен немедленный доступ к терминологии, специфичной для темы. И данные, которые он собирает, хранятся только на жестком диске. Это устраняет риск раскрытия личной письменной деятельности и интересов наблюдающей третьей стороне. «First Draft не зависит от Интернета, – говорит Николь. – Итак, что входит в первый черновик, остается в первом черновике». Также новой является удобная функция обучения, которая позволяет писателям настраивать то, что программа узнает из их собственного контента. Он был создан, чтобы помочь программе не только строить и понимать взаимосвязи между различными темами, но и обращаться к этим взаимосвязям при создании нового материала. И, как и все функции First Draft с 2014 года, эта функция также сохраняет данные на жестком диске писателя. Миллер добавил: «То, как писатели используют программное обеспечение, создает личное взаимодействие, которое не должно быть доступно посторонним, независимо от того, являются ли эти незнакомцы хакерами, или другими писателями, имеющими доступ к тому же серверу компании.
Большее внимание развитию искусственного интеллекта в данном направлении придают такие компании, как Google, Apple, и ряд других перспективных корпораций ИТ-сектора. Необходимо отметить, что разработки ведутся в большей степени не для того, чтобы обучить искусственный интеллект заниматься искусством, а для наработки фундаментальной базы, вследствие которой могут быть расширены границы возможностей ИИ [5].
Несмотря на это, у компании Google уже имеется практическая реализация проекта Google Deep Dream, посредством которого инженеры получают широкие возможности для создания ИИ, имеющего интуицию для занятия творчеством. Данный алгоритм работает по системе обучения GUN, при которой один модуль ИИ анализирует огромные базы художественных произведений и создает по их мотивам другие, а уже второй модуль начинает учиться по новосозданным текстам. Данная система основана на работе по принципу человеческого мозга, ведь человек анализирует не реальные объекты искусства, а свои интерпретации [6].
Заключение
Таким образом, основной целью данной статьи являлось изучение возможности и практики использования систем искусственного интеллекта для анализа литературных текстов. В заключение необходимо отметить, что ИИ имеет колоссальный потенциал при своем использовании во время решения задач социально-гуманитарного характера. Исходя из этого, на сегодняшний день должны выделяться намного большие финансовые и трудовые ресурсы в область данной темы относительно текущего состояния развития.
Список литературы Искусственный интеллект как инструмент анализа литературных текстов
- Осипов Г.С., Чудова Н.В. Возможности методов искусственного интеллекта в психологических исследованиях сетевой коммуникации // Экопсихологические исследования. 2020.
- Максимов А.Г. Искусственный интеллект как автор и соавтор литературного произведения // Вестник ННГУ. 2021.
- Искакова Ж.Т., Кашкин С.Ю. Современное авторское право и проблемы развития искусственного интеллекта // Вестник Университета имени О.Е. Кутафина (МГЮА). 2020. № 2. С. 43–52. DOI: https://doi.org/10.17803/2311-5998.2020.66.2.043-052
- Наумов В.Б., Тытюк Е.В. К вопросу о правовом статусе «Творчества» искусственного интеллекта // Правоведение. 2018.
- Мартьянова Е.Ю. К вопросу об определении субъекта авторства в отношении произведений, созданных искусственным интеллектом // Пермский юридический альманах. 2019. С. 241–256.
- Искусственный интеллект: автоматизированный анализ текста на естественном языке для аудита радиологических исследований / С.П. Морозов [и др.] // Вестник рентгенологии и радиологии. 2018. С. 253–258.
- Гарбук С. Интеллектуальные технологии вместо человека: оценка соответствия // Открытые системы. СУБД. 2018. № 2. С. 20.
- Азимбаев Д.Ж., Куан И.А., Гулида И.В. Искусственный интеллект и машинное обучение // Вестник современных исследований. 2019. № 1.3 (28). С. 6–7.
- Головенко А.П. Использование искусственного интеллекта в инновационных системах // Вестник современных исследований. 2018. № 12.5 (27). С. 67–68.
- Латфуллина Д.Р. Человеческий разум и искусственный интеллект // Ученые записки Казанского филиала «Российского государственного университета правосудия». 2018. Т. 14. С. 512–516.
- Иоселиани А. Д. «Искусственный интеллект» vs человеческий разум // Манускрипт. 2019. Т. 12, № 4. С. 102–107.
- Проскурин И.Е. Обзор методов искусственного интеллекта, с особой ссылкой на сферу образования // Инновационные технологии в машиностроении, образовании и экономике. 2019. № 1. С. 46–57.
- Рассел С., Норвиг П. Искусственный интеллект: современный подход. М.: Диалектика, 2019. 1407 с.
- Исхакова А.Ф. Применение искусственного интеллекта // Вестник современных исследований. 2018. № 9.3 (24). С. 261–262.
- Колесникова Г.И. Искусственный интеллект: проблемы и перспективы // Видеонаука: сетевой журн. 2018. № 2 (10).
- Солнцева О.Г. Аспекты применения технологий искусственного интеллекта // E-Management. 2018. № 1.
- Смилянский Л.Ю., Цыба О.С. Искусственный интеллект: проблемы и пути их решения // Устойчивое развитие науки и образования. 2018. № 9. С. 239–242.
- Ромашкова И.А., Аболихина Е.С. Проблемы развития искусственного интеллекта и пути их решения // Молодежный научный вестник. 2018. № 1 (26). С. 118–120.
- Осипов Г. Лекции по искусственному интеллекту. М.: Editorial URSS, 2018. 272 с.
- Михайлова И.С., Шевцов В.В. Перспективы использования искусственного интеллекта в сфере образования // Современные научные исследования и разработки. 2018. № 6 (23). С. 475–476.