科研星球

高被引论文标题都有哪些特征?

标题是论文的“眼睛”,在论文的发表、检索、下载、阅读和被引过程中起着重要作用。


国外关于学术论文标题的研究文献虽较多,但有关标题和论文被引关系方面的文献却很少,研究主要包括:有趣标题和论文被引次数关系分析;论文下载次数和被引次数相关性成正比;标题长度和论文被引次数比较分析,Subotic等和Jamali等认为长标题论文下载和被引次数比短标题论文少,而Habibzadeh等和Jacques等的研究结果却恰恰相反,强调较长标题的论文被引次数多;复合式标题的使用情况,一般认为带冒号的标题所占比例较多;以及疑问句型标题的使用情况。

而国内,中国知网数据库中关于论文标题与论文下载被引关系方面的论文仅见《论文标题与下载和被引的关系》一篇。作者林佳瑜选取的论文标题集中在生物医学相关领域,认为短标题比长标题论文的被引和下载次数都多;论文下载次数与被引次数成正比;带冒号的标题虽长但下载和被引次数却多;问题型标题少但被引次数多。

这些研究文献对了解论文标题起到了积极作用。

纵观上述研究不难发现,问题焦点在于Habibzadeh等和Jacques等认为较长标题论文被引次数和下载次数多,与林佳瑜、Subotic等和Jamali等的观点明显相反。

而CSSCI期刊论文标题的长度与被引次数、下载次数之间又会存在何种关系?本文将在分析语料库的基础上,对比研究CSSCI期刊高被引和低被引论文标题在长度上的差异,探讨论文下载次数和被引次数之间的内在关系,并深入分析复合式标题和疑问句式标题在CSSCI期刊论文中的使用情况及其相关特征。

1
研究方法



本研究采用线性回归分析,假定论文标题长度为自变量,论文下载次数为因变量,确定回归线斜率,数据统计以平均数呈现。相关数据通过Excel软件进行处理,并利用SPSS 16.0与Origin 7.5软件进行统计分析。

为缩小因时间跨度而导致的被引和下载数据差异,本文采用Habibzadeh等的方法,所有数据集中在北京时间2014年3月28日上午3个小时内完成采集。语料库(见表1)具有以下特点。

(1)全部论文标题均选自CSSCI期刊,论文发表时间限定于2010年。期刊按照2014年CNKI数据库显示的复合影响因子高低进行排列。

(2)原始语料库包括论文标题4 306条,为确保皆为学术论文标题,经仔细逐条阅读,剔除所有声明、启示、资讯等,最终保留3442条。

(3)语料库包括:复合影响因子>5的4个期刊的论文标题;复合影响因子≤0.2的4个期刊的论文标题;语料采集时被引次数为零的2010年论文标题1 215条和相应的被引次数高且排名前1 215的论文标题。

0 (6).png

2
研究结果



2.1 论文标题长度和被引次数比较分析

表1所示语料库中,全部论文平均标题长度为19.6字(包含空格);单篇论文被引次数范围为0~363,平均为25.2次。论文标题长度和相应论文被引次数回归线斜率从《中国法学》的-1.356 4(P=0.621)到《民国档案》的0.041 1(P=0.270)范围变动。

其中5个分语料库回归线斜率为负(-1.3564~-0.1337),且均为复合影响因子较高或被引次数较多的分语料库,趋势线呈下降趋势,见图1(a);其余5个分语料库回归线斜率都比较接近0,且均为复合影响因子较低或被引次数较少的分语料库,趋势线呈上升趋势。表明期刊复合影响因子较高和被引次数较多的论文库中,短标题论文比标题论文被引次数多。然而,全部论文线性回归线斜率为0.3441,对数趋势线呈明显上升趋势。

同时,本研究对5个被引次数较多的论文库和5个被引次数较少的论文库论文标题长度和被引次数进行对比分析,结果表明:5个被引次数多的论文库标题平均长度为21.2字,平均被引37.7次;而5个被引次数少的论文库平均标题长度为17.5字,平均被引0.84次,差异极其显著(P<0.01), 充分表明标题较长的论文被引次数较多。

0 (10).png

本研究对各分语料库平均标题长度与平均引用次数进行关联分析,结果显示:随着论文标题平均字数的增长,论文平均引用次数显著增加(P<0.01),如图2所示,线性回归线斜率高达4.663,对数趋势线呈明显上升趋势。充分表明标题平均字数与论文平均被引次数呈明显正相关。总体而言,较长标题的论文被引次数比较短标题的被引次数多。

0 (7).png

2.2 论文被引次数和下载次数相关性分析

论文下载次数与被引次数相关性散点趋势如图1(b)所示,本研究所统计的10个分语料库及总体趋势线呈明显上升趋势;除《民国档案》等少数几个期刊外,大部分期刊趋势线都经历了三个阶段:直线上升期(272,13.1)、指数(对数)增长期(5 125,75.3)、平台期,表明CSSCI期刊论文的引用率和下载量成明显正相关。

2.3 复合式标题分析

为研究复合式和疑问式标题在CSSCI期刊中的应用情况,从3 442条标题中挑选出复合式和疑问式标题,并统计其在各期刊中的数量及所占比例(见表1)。全部论文库中,复合式标题所占比例最低为《民国档案》的14.7%;最高为《会计研究》的48.5%;总体平均所占比例为31.3%。

5个被引次数较多的论文库中复合式标题平均所占比例为40%,明显高于5个被引次数较少的论文库平均复合式标题比例22.3%。最短复合式标题长为6个字,最长达67个字,平均为28个字。以上数据表明:复合式标题在CSSCI期刊论文中所占比例较高,且字数较多,被引次数较多的论文更倾向于使用复合式标题。本研究所统计11个论文库中,复合式标题论文平均引用次数最高为54.7(高被引用论文库),最低为0(低被引论文库)(图3(a))。

6个论文库复合式标题论文平均引用次数高出相应论文平均引用次数,最高为《会计研究》的36.3,明显高于该期刊论文平均引用次数31.2。除零被引用论文库、《经济研究》(27.8与44.2)和《中国法学》(20.2与32.8)外,其他论文库二者引用次数均较为接近,无显著性差异(P>0.05)。图3(a)所示复合式标题论文的平均被引次数和论文库论文平均被引次数也成正相关。更值得一提的是,语料库中被引次数最高的论文标题正是复合式标题“低碳旅游:一种新的旅游发展方式”(《旅游学刊》,被引次数为363)。

复合式标题论文平均下载次数最高论文库为《会计研究》(2 368),明显高于该期刊论文平均下载次数(2 150);最低为《管子学刊》(138),稍低于该期刊平均下载次数(156)。而且,7个论文库复合式标题论文平均下载次数高于相应论文平均下载次数(见图3(b));除《经济研究》(2 775与2 131)和《中国法学》(1 729与1 369)外,其他论文库也均较为接近,无显著性差异(P>0.05)。综上表明,复合式标题论文在CSSCI期刊论文中所占比例较高,而且论文的被引率和下载量都相对较高。

0 (9).png
0 (8).png

2.4 疑问式标题分析

3442条论文标题中,疑问式标题仅有61条(见表1),所占比例最高为18.1%(高被引论文库),其中《中国社会科学》《民国档案》《宗教学研究》等3种期刊未见疑问式标题。

61个疑问式标题平均被引次数为30.5,平均下载次数为1 518,标题平均长度为22.3字,均高出全部论文相应平均值25.2、1 186和19.6,这说明疑问式标题的平均被引次数、下载次数比较多,且标题较长。

同时发现,61个疑问式标题中34个标题也是复合式标题(占55.7%),例如“安达信倒塌:研究发现了什么?”。

3
讨论



对于学术期刊论文标题长度与被引率之间的关系,国内外存在较大争议:林佳瑜、Subotic等和Jamali等认为标题较短的论文被引率高而本文研究结果表明,长标题论文比短标题论文引用率高,与Habibzadeh等和Jacques等观点相同。

为解决这个问题,本研究针对CSSCI语料库中3 442条论文标题特征进行对比研究,发现标题长的论文引用次数明显高于标题短的论文(P<0.05)。此外,采取林佳瑜的统计方法,选出3 442条标题中所有被引次数为零的1 215条标题和被引率排前1 215位的标题,分别进行统计,其平均字数分别为18.3和20.9。

再次证明本文结论:较长标题论文被引次数比短标题论文高。但这并不意味着林佳瑜[6]的结论有误,因为本文分析研究了不同领域的期刊,说明生物医学类期刊与CSSCI期刊论文标题长度和被引次数之间存在较大差异。

从20世纪60年代开始,复合式论文标题在很多研究领域的期刊中急剧增加。本研究结果表明:复合式标题在CSSCI期刊论文中所占比例较高,平均比例为31.3%,明显高于Haggan21.5%的统计结果。复合式标题论文下载和被引次数与论文库论文平均下载和被引次数相近。

这与Jacques等和林佳瑜的观点一致,与Jamali等观点相反。同时,复合式标题的字数多、被引次数多,也在一定程度上增加了较长标题被引次数多的比例。1 079个复合式标题中,带破折号的标题有793条(其中27条标题既带冒号又带破折号)占复合式标题的73.5%;带冒号的标题有286条,占26.5%。

这说明中文论文复合式标题喜欢用破折号,这与英文论文相反,如刘永芳[11]认为英文论文带冒号的标题占复合式标题中的98.2%。伦道夫•夸克[12]分析认为,英语中冒号后面的内容用来说明冒号前面的内容,而破折号用来表示停顿或错格,故多用冒号。全部标题中疑问式标题共61条,占全部论文的1.8%,比王成宇[13]的统计结果1.16%稍高。

本研究结果显示:疑问式标题所占比例虽小,但下载和被引次数却比较高,这与林佳瑜[6]的观点相同;而Jamali等则认为疑问式标题论文下载次数多但被引次数少。

值得指出的是,本研究发现61个疑问式标题中有34个标题同时也是复合式标题,且其中12个标题中的疑问成分可以省略而不影响标题内容。疑问式标题大多已丧失了疑问功能,其主要目的在于引起读者的充分注意(王成宇),这也是其下载和被引次数相对较多的原因。

4
结语



本研究结果表明:标题较长的论文比标题短的论文被引率高,高被引论文标题中复合式标题所占比例高;疑问句式标题在语料库中所占比例小,但下载次数和被引次数较多。

论文标题“居文之首,勾文之要”,值得再三推敲和研究,希望本研究能够对科研工作者、期刊编辑者、高校师生撰写或编审高质量论文标题提供有价值的参考。



相关推荐:
没有账号?