Аналитическое приборостроение в журналах Nature и Science за 2001-2017 гг. Вебометрический анализ
Автор: Архипов Д.Б., Буляница Антон Леонидович, Щербаков А.П.
Журнал: Научное приборостроение @nauchnoe-priborostroenie
Рубрика: Математические методы и моделирование в приборостроении
Статья в выпуске: 3 т.29, 2019 года.
Бесплатный доступ
Проведен вебометрический анализ журналов Nature и Science за 2001-2017 гг. По каждому году выбраны 10 наиболее цитируемых статей. Число ссылок определялось по Web of Science и Google Scholar. Было установлено, что из 170 статей не менее 85 имеют прямое отношение к аналитическому приборостроению. Формальным критерием выбора было наличие в статье упоминания какого-либо аналитического прибора (например, секвенатора). Также была проанализирована динамика цитирования статей и предложена легко интерпретируемая математическая модель процесса цитирования.
Вебометрический анализ, высокоцитируемые публикации, аналитическое приборостроение, динамика цитирования, математическая модель, число ссылок
Короткий адрес: https://sciup.org/142218208
IDR: 142218208 | DOI: 10.18358/np-29-3-i6368
Текст научной статьи Аналитическое приборостроение в журналах Nature и Science за 2001-2017 гг. Вебометрический анализ
Журналы Nature (Лондон), выпускаемый с 1869 г. и Science (Вашингтон), выпускаемый с 1880 г., входят в десятку наиболее цитируемых журналов мира. В отличие, например, от Physical Reviews и Cell эти журналы доступны для неспециалистов. Классический наукометрический анализ малоэффективен для оценки распределения статей по областям науки, поскольку доли статей, относящихся к различным областям, таким как астрономия, физика, химия, науки о Земле, биология и гуманитарные науки сопоставимы. При этом число ссылок на одни статьи измеряется десятками, а на другие — тысячами.
В XXI в. Nature и Science публиковали 800–850 статей в год. Для определения числа ссылок использовались международные библиометрические базы Web of Science и Google Scholar (методика описана в статье [1]).
Основные наблюдаемые закономерности.
-
1. В среднем цитирование в Google на 50% выше, чем в Web of Science, но бывают исключения.
-
2. По сравнению с 1965 г. число статей в Nature упало в 4 раза. Это связано с тем, что кроме этого журнала под названием Nature в настоящее время выходит около 30 журналов, например NaturePhotonics или NatureMicrobiology.
Проблема старения научной литературы заслуживает отдельного исследования. В настоящее время наиболее цитируемой статьей (214 524 ссылки по Google на 15.11.2018 г.) является коло- риметрический метод количественного определения белков в растворе, предложенный Лоури в 1952 г. [2]. Вместе с тем большинство статей в Nature и Science за 1977 г. цитируются скромно по сравнению с современными. 24.02.1977 г. Сенгер опубликовал в Nature две статьи по применению гель-электрофореза для секвенирования ДНК. Одна из них имеет 1955 ссылок, другая — 54. В декабре того же года он опубликовал в Proceedings of the National Academy of Sciences методическую статью по "методу Сенгера" [3], хотя в те годы английские ученые редко публиковались в американских журналах. Эта статья на 15.11.2018 имела 73 301 ссылки по Google и занимала четвертое место по цитированию.
ЗАДАЧИ. МЕТОДИКА РЕШЕНИЙ
В статье использованы два способа определения числа ссылок. В первом: к числу ссылок по Web of Science прибавляется число ссылок по Google Scholar. Во втором способе число ссылок в Web of Science умножается на 1.5. Оба этих способа имеют аргументацию в свою пользу.
При анализе динамики числа публикаций (распределения числа цитирований по годам после выхода статьи) и при оценке связи между цитируемостью наиболее цитируемой и десятой по цитируемости статьями по каждому году можно использовать условные (нормированные) показатели цитирования.
При решении первой задачи ключевой является зависимость от времени, во втором случае исполь-

Динамика ежегодного числа цитирований статьи [4].
По оси абсцисс — годы (число лет) после публикации, по оси ординат — число ссылок зуется корреляционный анализ. Как известно, коэффициент корреляции инвариантен к изменению масштаба и линейному сдвигу шкалы отсчета.
Ранее для других групп публикаций авторами была предложена математическая модель [1] зависимости цитирования (числа ссылок) от времени. Формально эта зависимость представляет собой произведение убывающей линейной функции (учет морального старения информации) и логистической функции первого порядка, позволяющей описывать процесс распространения информации (аналогично динамике развития спроса на товары). Задачей авторов было оценить правомерность применения этой модели к специальной группе научных статей — статей, имеющих высокое цитирование.
При решении второй задачи на основе вычисленного коэффициента корреляции проверяется следующая аналогия: если число цитирований статьи можно рассматривать как случайную величину, то ранжирование статей по числу цитирований представляет собой процесс упорядочивания выборки (построение вариационного ряда). Таким образом, вычисляется коэффициент корреляции между первой и 10-й порядковыми статистиками. Всего элементов упорядоченной выборки порядка 800–850. Из теории известно, что близкие друг к другу порядковые статистики должны быть положительно коррелированы.
РЕЗУЛЬТАТЫ И ИХ ОБСУЖДЕНИЕ
В 2001–2017 гг. Nature и Science суммарно опубликовали в общей сложности около 28 тыс.
научных статей. В перечень для рассмотрения попали по 10 наиболее цитируемых статей за каждый год плюс самая цитируемая статья за декабрь 2017 г., что составляет 0.6 %.
Из рассматриваемого набора 170 высокоцити-руемых статей для анализа динамики цитирования и проверки адекватности ранее описанной математической модели [1] выбрана публикация [4] 2005 г. Во-первых, эта статья относится к средним по цитированию работам из группы рассмотренных, во-вторых, период цитирования 2006– 2018 гг. позволяет оценить динамику ежегодного числа ссылок и оценить параметры модели с достаточной точностью.
Зависимость числа ссылок на публикацию и аппроксимирующая зависимость представлены на рисунке.
Математически указанная зависимость выражается формулой:
X [ N ] = (1 – N /15.27)·1037.35/(1+13.16 exp(–0.754 N )).
Здесь N — число лет после публикации, X [ N ] — число цитирований в N -й год после публикации. Коэффициент детерминации зависимости превышает 0.93.
Значение характерного временнóго интервала в модели — 15.27 г. — характеризует время практически полной потери интереса (актуальности) к публикации. Ранее авторами были рассмотрены аналогичные модели активности цитирования на примере журналов Американского химического общества (АХО) для трех групп публикаций: лидеров цитирования, статей со средним цитированием и аутсайдеров. Соответствующие величины вре-меннóго показателя равны 73.35, 30.20 и 21.60 г.
Табл. 1. Распределение уровня цитируемости по годам за период 2001–2017 гг. для двух выбранных публикаций (наиболее цитируемой и 10-й по цитируемости)
Год |
Количество ссылок |
Год |
Количество ссылок |
|||
Наиболее цитируемая статья |
10-я по цитируемости |
Наиболее цитируемая статья |
10-я по цитируемости |
|||
2001 |
42662 |
10930 |
2010 |
12060 |
5431 |
|
2002 |
24505 |
13595 |
2011 |
11930 |
4860 |
|
2003 |
15824 |
8420 |
2012 |
16320 |
6125 |
|
2004 |
89919 |
8003 |
2013 |
13617 |
6580 |
|
2005 |
35850 |
9450 |
2014 |
8530 |
4439 |
|
2006 |
23210 |
11445 |
2015 |
7443 |
3581 |
|
2007 |
18341 |
8172 |
2016 |
6405 |
1744 |
|
2008 |
27356 |
7602 |
2017 |
3139 |
799 |
|
2009 |
20772 |
7191 |
— |
— |
— |
Табл. 2. Распределение числа статей по тематике из перечня высокоцитируемых статей для различных временн ы х периодов
Область знаний |
Временной период, годы |
||
2001–2006 |
2007–2012 |
2013–2018 |
|
ДНК и РНК |
20 |
28 |
18 |
Солнечные батареи |
0 |
2 |
15 |
Физика |
16 |
19 |
3 |
Молекулярная биология |
10 |
6 |
4 |
и медицина |
|||
Химия |
4 |
1 |
4 |
Экология |
5 |
1 |
2 |
Всего: |
60 |
60 |
50 |
Т.е. в этом исследовании интерес к тестовой публикации [4] убывает (до нулевого цитирования) существенно быстрее, чем для статей АХО всех групп цитирования.
В табл. 1 приведены данные по числу ссылок на 1-ю и 10-ю по цитированию статьи в каждый из рассматриваемых годов публикации (с 2001 до 2017 г.)
Вычисление коэффициента корреляции производилось по двум методикам: выборочный коэффициент корреляции Пирсона и ранговый коэф- фициент корреляции Спирмена. Оценка выборочного коэффициента корреляции равна +0.478, рангового — (+0.848).
Столь сильное расхождение объясняется неро-бастностью (малой устойчивостью к выбросам) выборочного коэффициента корреляции. Среди элементов выборки по максимальному цитированию есть аномально высокое значение — 89 919. Если его исключить, то оценки коэффициентов корреляции уточнятся и сблизятся по величине: по Пирсону +0.800, по Спирмену +0.900. И та, и дру- гая оценки свидетельствуют о наличии значимо большой положительной корреляции, что соответствует теории вероятностей и статистики, а именно свойствам порядковых статистик.
Другой задачей было исследование распределения числа (доли) высокоцитируемых статей по различным областям знаний и его динамики в зависимости от периода публикаций. Основные результаты иллюстрируются данными табл. 2.
Из данных табл. 2 видно, что наибольшее число высокоцитируемых статей приходится на анализ нуклеиновых кислот, невозможный без определения последовательности нуклеотидов. Во всех способах секвенса необходима полимеразная цепная реакция (ПЦР). Первая статья по ПЦР была опубликована в журнале Science в ноябре 1985 г. Затем были изобретены ПЦР в реальном времени, цифровая ПЦР и цифровая ПЦР в капле [5]. Практически во всех приборах ПЦР используется флуориметрический детектор. До 2005 г. все секвенаторы использовали гель-электрофорез, вначале плоскослойный, затем в капиллярах, а с середины 1990-х гг. — в чипах. В сентябре 2005 г. журнал Nature опубликовал статью по усовершенствованному пиросеквенсу. В этом приборе вместо электрофореза используются биоспецифические методы разделения, а вместо флуоресцентного детектирования — биолюминесцентное. В пионерской работе по определению полного генома человека (Джеймса Уотсона) был использован именно пиросеквенатор [6].
Три основных наблюдаемых тенденции.
-
А. Многократное возрастание числа статей, относящихся к солнечным батареям.
Б. Число статей, касающихся других разделов физики, уменьшается. Однако суммарно число статей по указанным обеим группам примерно стабильно составляет около трети всех высокоци-тируемых публикаций,
-
В. Устойчивое убывание числа статей, относящихся к молекулярной биологии. При этом динамика публикаций по РНК и ДНК, химии и экологии носит колебательный характер.
Для изучения работы клетки необходимо знать не только последовательность нуклеотидов, но и последовательность аминокислот в белках. Для решения этой задачи используют капиллярную жидкостную хроматографию в сочетании с тандемной масс-спектрометрией (МС) и дополнительно МС с матрично-активированной лазерной десорбцией/ионизацией (МАЛДИ). Для определения вторичной структуры белков в настоящее время используют криоэлектронную микроскопию.
Квантовые точки и наночастицы на основе золота или серебра начали использовать в аналитической химии в конце XX в. В XXI в. были изо- бретены графены, а затем и другие двумерные наноструктуры. Первая статья по графенам была опубликована в журнале Science в октябре 2004 г. Она имеет лучшее цитирование среди всех статей Nature и Science за рассматриваемый период. Судя по публикациям в Analytical Chemistry и других журналах Американского химического общества, графены используют в самых разных областях аналитической химии [7]. Синтез графенов впервые осуществили московские физики, работающие в Манчестерском университете — Новоселов и Гейм. В табл. 2 графены включены в раздел "Физика".
Из статей, никак не связанных с аналитическим приборостроением, лучшее цитирование имеют статьи по солнечной энергетике. Прорыв в этой области вызван использованием редких природных минералов перовскитов. Солнечная энергетика может в разы уменьшить себестоимость опреснения морской воды, что крайне актуально, например, для Саудовской Аравии. Статьи по экологии не являются статьями по экоаналитике — используется биометрия.
ЗАКЛЮЧЕНИЕ
Проанализирован перечень наиболее цитируемых статей в Nature и Science, по 10 за каждый год. Установлена значимая корреляционная связь между уровнем цитирования наиболее цитируемой и 10-й по цитированию статьей по каждому году. Этот результат теоретически обоснован свойствами порядковых статистик. Динамика цитирования статьи из данного перечня описывается закономерностями, аналогичными рассмотренным ранее для больших групп высоко-, средне- и мало-цитируемых статей из журналов Американского химического общества. Зависимость представляет собой произведение логистической кривой Фер-хюльста, что характерно для широкого круга популяционных процессов, и линейной убывающей функции, моделирующей падение интереса к научной информации (моральное старение). Численные коэффициенты, характеризующие временные особенности динамики и масштаб публикационной активности, иные. Характерный масштаб цитирования составляет порядка 1000 цитирований, характерное время морального старения — около 15 лет.
Распределение публикаций по областям знаний показало существенное различие по 3 временным диапазонам: 2001–2006, 2007–2012 и 2013– 2018 гг. Основные изменения связаны с возрастающей долей публикаций по солнечным батареям за счет других разделов физики, устойчивое убывание доли публикаций по молекулярной биологии и колебательный характер публикационной активности по химии, биологии и конкретно по ДНК и РНК.
Работа выполнена в рамках Государственного задания № 075-00780-19-00.
Список литературы Аналитическое приборостроение в журналах Nature и Science за 2001-2017 гг. Вебометрический анализ
- Архипов Д.Б., Буляница А.Л., Щербаков А.П. Вебометрический анализ и его использование для изучения тенденций развития аналитического приборостроения//Научное приборостроение. 2014. Т. 24, № 2. С. 52-60.
- Van Noorden R., Maher B., Nuzzo R. The top 100 papers//Nature. 2014. Vol. 514, no. 7524. P. 550-553. DOI 10.1038/514550a
- Sanger F., Nicklen S., Couslon A.R. DNA sequencing with chain-terminting inhibitors//Proc. Natl. Acad. Sci. USA. 1977. Vol. 74, no. 12. P. 5463-5467.
- Margulies M., Egholm M., Altman W.E. et al. Genome sequencinng in microfabricated high-density picolitre reactors//Nature. 2005. Vol. 437. P. 376-380 DOI: 10.1038/nature03959
- Hindson B.J., Ness K.D., Masquelier D.A. et al. High-throughput droplet digital PCR system for absolute quantification of DNA copy number//Anal. Chem. 2011. Vol. 83, no. 22. P. 8604-8610 DOI: 10.1021/ac202028g
- Watson J.D. The human genome project: past, present, and future//Science. 1990. Vol. 248, no. 4951. P. 44-49 DOI: 10.1126/science.2181665
- Novoselov K.S., Geim A.K., Morozov S.V., Jiang D., Zhang Y., Dubonos S.V., Grigorieva I.V., Firsov A.A. Electric field effect in atomically thin carbon films//Science. 2004. Vol. 306, no. 5696. P. 666-669 DOI: 10.1126/science.1102896