科研星球

R语言包安装方法,及优质包推荐

R语言,之所以能成为统计学的“当红炸子鸡”,因为它内置了海量统计函数,使用者可以利用其对数据进行快速的交互分析,在数据分析界是当之无愧的“瑞士军刀”。


因此,通过R语言,不仅能做出很多高质量的美腻又直观的数据图,还能巧借他人数据,“无中生有”的获得可用于发表SCI的研究数据。


真可谓是,R语言在手,年输出SCI过3篇并不罕见。R语言如此给力,对于临床和科研兼顾的医学工作者来说是一个极大的助力。


但凡对R语言稍有涉猎的研究者们,都应知晓R语言中强大的安装包(Package)。


它就像R语言这个游戏里要用到的装备,种种装备都各自有特定的功能(功能就是函数,即Function)——有专用于数据分析的包,也独属于画图的包。所以要在R这个战场上玩转数据,就得配上不同的装备。


当然安装R的时候会有一些自带的包(大约25个),用它们来做简单的分析也足够了,但对于复杂一点的分析,或者想要画出好看一点、复杂一点的图,就要通过CRAN获取一些稍高级一点的包。


目前,CRAN上已有超过10000个包,而且目前还在不断涌现……这些包涵盖多个领域,从统计计算到机器学习,从生物信息到社会网络分析,可以说无所不包。


R语言的包确实给人一种乱花渐欲迷人眼的感觉,但其实,对医学研究者而言,只有能熟练掌握以下十个包,就可以满足做医学统计的全部需求。



包的下载安装方法


R包的安装有多种方式,安装时请确保计算机处于联网状态。


在R的菜单交互界面下,单击“程序包”|“安装程序包”后,在弹出的窗口中选择一个镜像站点。


0.jpeg


0 (1).jpeg


镜像站点列表以国家名为前缀,一般选择自己所在国家的镜像站点下载速度会比较快。


然后,找到需要安装的包的名字,单击“确定”即可安装。


0 (2).jpeg


如果使用的Rstudio,可以通过单击Rstudio界面右下方其他菜单栏的“Package”|“Install”按钮,然后输入包的名字进行安装。


0 (3).jpeg


0 (4).jpeg


或者,在R或Rstudio的控制台使用函数install.packages()进行安装。


0 (1).png


此处注意:R语言是区分大小写的!每一个命令都是如此。不过如果输错了,也会智能的给个提示:


0.png


当R语言包安装后,还需要用函数library()或require()加载到内存以后才能使用其中的函数或数据集。



十大好用R语言包



1

数据可视化



ggplot2
ggplot2是最常用、最受用户们喜爱的作图工具包了,被誉为数据作图的标杆。它做出的图不仅漂亮,而且可以涵盖很多复杂的信息。网上也有大量关于它的教程,学习资源很丰富。

gridExtra
ggplot2的一个缺点就是不能像自带的graphics基础包那样,把几张图拼成一组图。而gridExtra就可以解决这个问题,把ggplot2做出来的漂亮的图组织到一张大图里。

lattice
lattice经常被拿来和ggplot2相提并论,这两者也是选择困难户的纠结点。ggplot2做出来的图更漂亮,但它入门难啊~lattice则适合入门选手,作图速度较快,还能进行三维绘图,这是ggplot2不具备的。


2

统计分析



lme4 (或者nlme)
如果你常做一些复杂的数据,实验分了好几个层,有好多亚组,亚组下面还有亚亚组,比如要做好几种细胞,检测好几个指标,每个指标还有不同的观察时间点……此时lme4包就可以比较轻松地把这些数据组织起来。nlme也一样,选一个就好。

forecast
比较适合分析时间序列数据。

zoo
forecast里有很多好用的内置函数,但有时候还需要更简单易用的计算移动平均、移动标准差的函数,这时zoo会是个很好的补充。

spatstat
空间分析神器,比如某种疾病发病率在地理空间上的分布特征等等。


3

数据整理



dplyr
dplyr可以很好地把数据随意分解、整合。这个包可能也比较难上手,但熟悉之后,就像老司机开车一样形成本能。


4

生物信息学



Bioconductor
对于做基因组或芯片分析、阵列、基因流等等的小伙伴,Bioconductor是个好选择。它还有个很活跃的用户社区,可获得及时反馈,每年更新2次,还有丰富的学习资源,比如http://www.bioconductor.org/help/course-materials/这里的一系列教程。

5

展示


knitr
虽然一开始说到的数据可示化也是展示的一种,但这里要说的是,通过更丰富的方式来展示其他多种内容。除了数据分析成果,还有分析过程中各种代码、运行过程、文本说明等,都可以通过knitr生成网页、PDF、幻灯片等形式展示出来。比较适用于教学、报告等场合。

shiny
shiny包也像knitr一样可以做出漂高的网页,此外还可以快速搭建动态的交互网页App。它一大优势就是不需要学习其他网页编程语言(CSS、JS等),纯靠R。

stringr
字符串处理神器。可在作图、网页编辑、数据清洗等操作中起到很好的辅助作用,对字符串进行拼接、匹配、变换等。

偶尔,一些可能会要用到函数,不在你安装过的包里,而且还不知道在哪个包,怎么办?就是在Packages选项卡旁边的Help里搜索,返回的结果中看到“一串字母::你搜的函数”,前面那串字母就是包的名字啦,比如这个Kest函数就是在spatstat包里,下载、安装、载入就可以用了~

将上述R语言包安装好后,一切就准备就绪了,接下来就是正式的数据分析了。也许,在正式使用R语言时,R语言新手会因R语言代码复杂而头痛不已,更有甚至,从此退避三舍……但是,关于R语言代码,仔细分解起来,还是很有规律的。


相关推荐:
没有账号?