第一部份:导论及基础知识
Slides
补充信息
R 和 RStudio 的安装
访问 https://posit.co/download/rstudio-desktop/,根据提示依次下载并安装 R 和 RStudio。RStudio 安装包的下载速度较慢,请选择网络状态良好时下载。
R 安装包中包含了运行 R 所需的文件,RStudio 则是为 R 量身定做的综合开发软件(IDE),两者的关系和电子书与阅读器之间的关系类似。我们通常不会直接调用 R,而是通过 RStudio 进行编程和执行,R 在后台被 RStudio 调用。
从 RStudio 的运行界面左侧面板的 Console 部份可以看到调用 R 的信息,例如第一行显示了正在使用的 R 版本号。
基本设置
在使用 RStudio 之前需要进行一些简单的设置。R 本体可以实现的功能不多,通常在使用的时候需要安装和调用各种工具包(package)。安装是通过网络服务器自动完成的,但默认的服务器有时会因为连接超时而造成安装失败,因此我们需要设置境内的镜像服务器。
1. 设置工具包的安装路径(repository)
第一步:打开菜单栏中的 Tools > Global Options...
窗口,并选择 Packages
项目
第二步:点击 Primary CRAN repository 右侧的 Change...
键,从弹出的窗口中选择一个中国境内的镜像网站(下图中选择的是清华大学的镜像网站 TUNA),并点击 OK
键。
第三部:回到 Global Option 设置窗口,点击 Apply
键完成设置。
2. 安装 fpp3 及相关工具包
工具包的安装可以通过菜单栏的 Tools > Install Packages ...
完成。本门课程所需的工具包名为 fpp3,它会自动安装其他需要调用的工具包。在 Install Packages 窗口中的 Packages 栏输入 fpp3,并确保下面的 Install dependencies 已被选中,然后点击 Install
键后等待安装完成即可(安装过程可能会花较长时间,需要耐心等待)。
3. 使用工具包
为了使用工具包中所包含的函数或数据集,我们需要在每次启动 RStudio 时(确切的说是开启一个 R session 时)调用它们。调用工具包的命令是 library()
,例如,在 Console 中输入
library(fpp3)
意味着调用 fpp3 包。敲击回车键后会显示类似下面的结果:
'tsibble':
Registered S3 method overwritten by
method from
as_tibble.grouped_df dplyr1.0.1 ──
── Attaching packages ────────────────────────────────────────────────── fpp3 3.2.1 ✔ tsibble 1.1.5
✔ tibble 1.1.4 ✔ tsibbledata 0.4.1
✔ dplyr 1.3.1 ✔ feasts 0.4.1
✔ tidyr 1.9.4 ✔ fable 0.4.1
✔ lubridate 3.5.1
✔ ggplot2
── Conflicts ─────────────────────────────────────────────────────── fpp3_conflicts ──::date() masks base::date()
✖ lubridate::filter() masks stats::filter()
✖ dplyr::intersect() masks base::intersect()
✖ tsibble::interval() masks lubridate::interval()
✖ tsibble::lag() masks stats::lag()
✖ dplyr::setdiff() masks base::setdiff()
✖ tsibble::union() masks base::union() ✖ tsibble
这表明你的 fpp3 包调用成功了。
如果继续输入下面的命令
|> filter(`Series ID`=="A3349640L") |> autoplot(Turnover) aus_retail
则会在右下面板的 Plots 中显示图表
4. 其他设置
在启动时不读取之前操作的历史纪录。在
Tools > Global Options ...
的General
项目中的 Workspace 部份,取消 Restore .RData into workspace at startup 的选择。这是为了避免因忘记自己之前做过的操作而导致出现错误的结果。使用 native pipe operator
|>
。在Tools > Global Options ...
的Code
项目中的 Editing 部份,选择 Use native pipe operator, |> (requares R 4.1 +)。此选项的作用见第二讲 slides。
使用建议
在使用时将输入法切换至英文。这是因为 R 命令中经常会用到英文(半角)符号,包括逗号、引号等。例如逗号在中文输入状态下是全角符号,在显示器中和英文逗号的区别并不明显(这是英文半角逗号, 这是中文全角逗号,),如果混用则会报错且不容易发现错误所在。
学会利用官方提供的帮助文档。官方帮助文档提供了命令的使用方法和补充信息,是学习的一手资料。虽然一开始不太容易看懂,但是一定要养成看帮助文档的习惯。可以用
help(xxx)
或?xxx
调取命令xxx
的帮助文档(xxx
可以是任何函数或数据集),或在 RStudio 的 Help 菜单中寻找其他有用信息。避免用中文命名文件或文件夹。在导入或导出数据的时候需要指示文件名和保存路径。此时如果包含中文字符,有可能出现意想不到的错误。初学阶段经验积累不够,准确定位错误原因是比较困难的,因此建议从根本上杜绝出现错误的可能性。
学习资料
练习使用 RStudio
RStudio 的官方说明文件 https://docs.posit.co/ide/user/ 提供了详细的使用方法。
零基础上手 R
如果想要快速上手 R 的使用方法,可以参考 A (very) short introduction to R (Torfs, P., & Brauer, C., August 2024)。根据作者所述,阅读并练习该文档中的所有内容大概需要 1–2 个小时。
Cheat Sheets
RStudio 的 Help 菜单里提供了一些 cheat sheets,即快速查询使用方法的指引文档,在查询未知命令时非常方便。建议保存在自己的电脑中随时查看。