Инфраструктура для публикации собственных баз данных на RIKEN SciNeS

Автор: Павлюк Л.А.

Журнал: Мировая наука @science-j

Рубрика: Основной раздел

Статья в выпуске: 7 (16), 2018 года.

Бесплатный доступ

В статье рассматривается созданная RIKEN BASE инфраструктура RIKEN SciNeS, позволяющая всем исследователям осуществлять публикацию своих личных баз и результаты исследований. Рассматриваются положительные для исследователей стороны новой инфраструктуры. Также рассматриваются технические характеристики данной системы и возможности её использования за пределами Японии.

База данных, проект, исследования, инфраструктура, информация

Короткий адрес: https://sciup.org/140263755

IDR: 140263755

Текст научной статьи Инфраструктура для публикации собственных баз данных на RIKEN SciNeS

RIKEN создал инфраструктуру RIKEN SciNeS, чтобы осуществить крупномасштабный выпуск данных в соответствии с международными стандартами формата Semantic Web. Таким образом, обеспечивается система построения инфраструктуры баз данных, основывающихся на биологии. Это результат исследования Отдела биоинформатики и проектирования систем института мозга RIKEN (Директор: Тетсуро Тойода).

Биология недавно развилась в отдельную дисциплину, которая вмещает в себе большое количество данных. Всё это привело к тому, что каждый человек может представить результаты своих исследований в форме баз данных, которые можно просмотреть в интернете. Хотя опубликовать данные можно и в журналах, многие исследователи хотят контролировать публикацию своих баз данных при помощи веб-сайтов. Поддержание публикации баз данных на веб-сайте было затруднительным для исследователей. Более того, так как количество исследователей возросло, увеличилось и число сайтов, публикующих исследования. В результате, подобные сайты стали очень сложными для использования [1].

RIKEN BASE разработал RIKEN SciNeS, как удобную инфраструктуру, которая позволяет исследователям публиковать свои личные базы данных в качестве комплекса их личных исследовательских результатов. К тому же, теперь исследователям нет никакой необходимости контролировать публикации на веб-сервере. RIKEN SciNeS помогает исследователям организовать виртуальный исследовательский проект в интернете. Он вмещает десятки тысяч исследовательских проектов. Эта система хранит конфиденциальные данные каждого отдельного проекта, и предоставляет исследователям возможность управлять неопубликованной информацией. Предполагается, что это улучшит управление данными в пределах исследовательского проекта. Базы данных, построенные по этой системе, соответствуют международным стандартам. RIKEN продолжит работу в области поддержания подобных баз данных через RIKEN Hub Database, что позволит исследователям из различных научных областей сыграть важную роль в международной исследовании.

Данное исследование было проведено, как внутренний рекламный проект со стратегическим исследованием. RIKEN SciNeS выпускается как пробная версия, которая может посоревноваться с браузером Firefox Web. Она была выпущена 31 марта одновременно с RIKEN Hub-database.

Интернет стал очень популярным средством для опубликования результатов исследований и научных презентаций. Еще недавно процесс выпуска индивидуальных баз данных в интернете часто использовался для опубликования выводов исследований. Однако научные журналы публиковали только исследовательские статьи, а для публикаций баз данных исследователям приходилось самим управлять веб-сайтами. Даже после публикации баз данных, затраты на поддержание услуг веб-сервера были большой обузой для ученых. Более того, с ростом исследователей возросло и количество сайтов. В результате подобные сайты стали очень сложными для пользователей [2].

Вообще, когда большое количество людей объединяются для создания текстового наполнения или контента, используется Wiki. Wiki позволяет людям добавлять контент, который прочитают люди, а не машины; это что-то вроде энциклопедии. Однако в биологии возникает необходимость сравнить подобный контент с огромным количеством экспериментальных данных при помощи компьютера. Таким образом, было сложно построить базу данных с подобным контентом, используя только Wiki. В результате появилась инфраструктура для создания баз данных. Этой инфраструктурой с большой степенью безопасности может свободно пользоваться каждый исследователь. Из-за глобальной недостачи специалистов в области биоинформатики, возникла необходимость развить новую систему, предлагающую создание контента и отличные возможности управления им. То есть различными текстовыми материалами можно управлять при помощи компьютера.

На сегодняшний день, Япония не осознала важность международного обеспечения подобной информационной инфраструктурой. Принято считать, что базы данных результатов исследования, в которые исследователи RIKEN внесли большой вклад, станут видимыми через информационную инфраструктуру, обеспеченную другими институтами. Главная задача на данный момент - обновление системы до тех пор, пока она не займет лидирующее положение в области систем баз данных.

RIKEN BASE создала RIKEN SciNeS как инфраструктуру, которая дает возможность публиковать личные базы данных, как комплекс результатов исследования. И нет необходимости поддерживать услуги веб-сервера [3].

Характеристики RIKEN SciNeS:

  • -    Обеспечивает параллельную работу десятков тысяч личных баз данных исследователей в интернете.

  • -    Гибкие настройки управления, которые облегчают работу человека.

  • -    Дает возможность вносить базы данных в неактивном состоянии, в то время как каждая активная группа отделена от остальных на высоком уровне безопасности.

  • -    Дает возможность прямой публикации баз данных из инфраструктуры.

  • -    Позволяет исследователям обновлять текстовое наполнение в пределах инфраструктуры без каких-либо затрат на поддержание системы даже после публикации.

  • -    Позволяет легко распространять данные в различных международных

форматах.

RIKEN SciNeS - это система построения баз данных инфраструктуры, которая была создана с целью помочь исследователям организовать виртуальный исследовательский проект, а также для сотрудничества десятков тысяч исследовательских проектных групп.

Для отделения каждого проекта на высоком уровне безопасности и гибкого управления опубликованной или неопубликованной информацией была разработана уникальная технология, отвечающая международным стандартам, таким как Semantic Web. В результате, используя функцию Wiki, мы сделали возможным создания контента со стандартизацией форматирования и словарем. К тому же появилась возможность управлять данными с компьютера [4].

RIKEN SciNeS - это интерфейс, который позволять создавать данные в формате Semantic Web. Соответственно, большое количество исследователей может сотрудничать друг с другом и публиковать данные исследований для последующего применения в различных целях. Данные, созданные в стандарте Semantic Web, могут быть автоматически переведены в особенный формат данных, используемый в различных областях технологий. Таким образом, он может быть использован как научное средство для опубликования баз данных исследователей. RIKEN BASE будет поддерживать управление базами данных, опубликованных в этой инфраструктуре, как RIKEN Hub Database.

Так уж сложилось, что Японии не удавалось обеспечить временную информационную структуру в отношении международного исследовательского сотрудничества. Теперь же даже базы данных результатов исследований, в которые исследователи института RIKEN также внесли вклад, будут доступны через информационную инфраструктуру, обеспеченную другими институтами. RIKEN SciNeS может быть использован для различных целей, например, для информационного сотрудничества. Таким образом, исследователи Японии получат возможность занять лидирующую позицию, как основная сторона в сфере международного сотрудничества.

Продвижение проекта RIKEN SciNeS осуществляется при поддержке Министерства образования, культуры, спорта, науки и техники. Вскоре будет выпущена базу данных растений и кристаллизации, которая будет содержать более миллиона данных [5]. Более того, в будущем планируется дать пользователям возможность загружать данные и обмениваться результатами исследований по лицензии Creative Commons Public License.

Semantic Web использует формат, дающий возможность автоматического управления компьютером. Таким образом, вероятно, в скором времени будет применяться автоматизированное управление компьютером, вместо просмотра огромного количества баз данных. Это даст возможность использовать интернет-публикации в биологии.

Более того, RIKEN SciNeS будет работать, как информационная инфраструктура для объединения исследователей в области биологии. Также в будущем планируется использовать инфраструктуру обмена информацией в области перевода. Вместе с Исследовательским центром аллергии и иммунологии института RIKEN планируется использовать инфраструктуру RIKEN SciNeS для создания сети, объединяющей специалистов в области иммунодефицита и врачей в Азии. RIKEN будет продолжать поддерживать международные исследовательские проекты.

Список литературы Инфраструктура для публикации собственных баз данных на RIKEN SciNeS

  • McQuilton, P., Gonzalez-Beltran, A., Rocca-Serra, P., Thurston, M., Lister, A., Maguire, E., Sansone, S.A.: BioSharing: curated and crowd-sourced metadata standards, Databases and data policies in the life sciences.Database 2016, 1-8 (2016)
  • Queralt-Rosinach, N., Pi˜nero, J., Bravo, A., Sanz, F., Furlong, L.I.: DisGeNET- 'RDF: harnessing the innovative power of the Semantic Web to explore the genetic basis of diseases. Bioinformatics. (2016) in press
  • Allan, C., Burel, J. M., Moore, J., Blackburn, C., Linkert, M., Loynton, S., & Swedlow, J. R. etal. (2012). OMERO: Flexible, model-driven data management for experimental biology. Nature Methods, 9(3), 45-53. PMID:22373911 DOI: 10.1038/nmeth.1896
  • Kume, S., Masuya, H., Kataoka, Y., & Kobayashi, N. (2016). Development of an Ontology for an Integrated Image Analysis Platform to enable Global Sharing of Microscopy Imaging Data. In Proceeding of 15th International Semantic Web Conference, poster session.
  • Sugahara, M., Asada, Y., Shimada, H., Taka, H., & Kunishima, N. (2009). HATODAS II: Heavy-atom database system with potentiality scoring. Journal of Applied Crystallography, 42(3), 540-544. 10.1107/ S0021889809012370 DOI: 10.1107/S0021889809012370
Еще
Статья научная