Исследователи ИСИЭЗ НИУ ВШЭ и Американской ассоциации содействия развитию науки изучили более 700 тысяч научных статей по физике высоких энергий из базы данных INSPIRE-HEP. Ученые выяснили, что нецитируемые статьи производят почти семь процентов ссылок — больше, чем некоторые группы цитируемых. Они также предложили более точную модель прогнозирования нецитируемости.
Исследование опубликовано в журнале Journal of Informetrics. Работа поддержана грантом Министерства науки и высшего образования России. Научную коммуникацию можно интерпретировать как процесс производства и потребления цитирований. Количество ссылок, которые даются в статье, или полученных ею цитирований, — это, в свою очередь, косвенный показатель производства или потребления научного признания. Статьи, которые чаще ссылаются на другие работы (экспортируют), чем цитируются сами (импортируют), — производители научного внимания. Потребители — статьи, которые больше цитируются другими, нежели цитируют сами.
Нецитируемые статьи выступают чистыми экспортерами. Таким образом, распределяя свое внимание между цитируемыми статьями, они участвуют в формировании научной коммуникации. Чтобы определить статистические связи между импортирующими и экспортирующими статьями, исследователи Института статистических исследований и экономики знаний (ИСИЭЗ) НИУ ВШЭ и
Американской ассоциации содействия развитию науки провели анализ почти 730 тысяч научных публикаций из базы данных INSPIRE-HEP. Ученые выбрали статьи по физике высоких энергий, опубликованные с 1970 по 2015 год, и разделили их на девять групп (квантилей), опираясь на полученные публикациями цитирования. Наиболее цитируемые вошли в первый квантиль (Q1), работы с нулевым цитированием — в девятый (Q9). То же самое деление ученые проделали, исходя из количества ссылок на другие статьи.
Авторы отмечают, что уровень цитируемости статей связан с уровнем цитируемости научных публикаций, на которые они ссылаются. Наибольшее количество цитирований (70,4 процента) статей из первого квантиля приходится на статьи также из первого квантиля, 16,2 процента цитирований первого квантиля — на статьи второго квантиля и так далее.
При переходе от Q1 к Q9 соотношение между ссылками и цитированием меняется. Так, статьи из Q1 набирают максимум цитирований (57,1 процент) и дают максимум ссылок (25,4 процента), публикации из Q2 генерируют одинаковое количество ссылок и цитирований (18,1 процент), статьи из Q3 производят 14,7 процента ссылок, привлекая лишь 10,7 процента цитирований, и далее по убывающей. Иначе дело обстоит с нецитируемыми статьями из Q9.
«Нецитируемые статьи из Q9 производят 6,8 процента ссылок, что соответствует генерации ссылок статьями из Q5. То есть их вклад непропорционально больший относительно ранга квантиля Q9. Любопытно, что после того, как мы убрали цитаты из нецитируемых статей, более 20 тысяч научных публикаций перешли в категорию нецитируемых», — отмечает один из авторов исследования, заведующая отделом исследований человеческого капитала ИСИЭЗ НИУ ВШЭ Наталья Шматко.
Авторы исследования также проанализировали динамику цитирования. Оказалось, что со временем рост числа ссылок обгоняет рост числа публикаций, а это приводит к снижению доли нецитируемых статей.
Кроме того, ученые предложили модель прогнозирования таких публикаций. «В наукометрии нецитируемые статьи традиционно выступают неудобным объектом. Существует проблема инфляции нуля: известные библиометрические модели не в состоянии точно предсказать долю нецитируемых статей в выборке. С помощью нашей модели мы смогли более точно, нежели коллеги, оценить вероятность нулевого цитирования», — комментирует соавтор исследования, главный научный сотрудник ИСИЭЗ НИУ ВШЭ Юрий Качанов.