第一部份:导论及基础知识

Slides

补充信息

R 和 RStudio 的安装

访问 https://posit.co/download/rstudio-desktop/,根据提示依次下载并安装 R 和 RStudio。RStudio 安装包的下载速度较慢,请选择网络状态良好时下载。

R 安装包中包含了运行 R 所需的文件,RStudio 则是为 R 量身定做的综合开发软件(IDE),两者的关系和电子书与阅读器之间的关系类似。我们通常不会直接调用 R,而是通过 RStudio 进行编程和执行,R 在后台被 RStudio 调用。

首次运行 RStudio 时的界面(Mac版)

首次运行 RStudio 时的界面(Mac版)

从 RStudio 的运行界面左侧面板的 Console 部份可以看到调用 R 的信息,例如第一行显示了正在使用的 R 版本号。

基本设置

在使用 RStudio 之前需要进行一些简单的设置。R 本体可以实现的功能不多,通常在使用的时候需要安装和调用各种工具包(package)。安装是通过网络服务器自动完成的,但默认的服务器有时会因为连接超时而造成安装失败,因此我们需要设置境内的镜像服务器。

1. 设置工具包的安装路径(repository)

第一步:打开菜单栏中的 Tools > Global Options... 窗口,并选择 Packages 项目

Global Options 中的 Packages

Global Options 中的 Packages

第二步:点击 Primary CRAN repository 右侧的 Change... 键,从弹出的窗口中选择一个中国境内的镜像网站(下图中选择的是清华大学的镜像网站 TUNA),并点击 OK 键。

选择 CRAN repository

选择 CRAN repository

第三部:回到 Global Option 设置窗口,点击 Apply 键完成设置。

2. 安装 fpp3 及相关工具包

工具包的安装可以通过菜单栏的 Tools > Install Packages ... 完成。本门课程所需的工具包名为 fpp3,它会自动安装其他需要调用的工具包。在 Install Packages 窗口中的 Packages 栏输入 fpp3,并确保下面的 Install dependencies 已被选中,然后点击 Install 键后等待安装完成即可(安装过程可能会花较长时间,需要耐心等待)。

安装工具包

安装工具包

3. 使用工具包

为了使用工具包中所包含的函数或数据集,我们需要在每次启动 RStudio 时(确切的说是开启一个 R session 时)调用它们。调用工具包的命令是 library() ,例如,在 Console 中输入

library(fpp3)

意味着调用 fpp3 包。敲击回车键后会显示类似下面的结果:

Registered S3 method overwritten by 'tsibble':
  method               from 
  as_tibble.grouped_df dplyr
── Attaching packages ────────────────────────────────────────────────── fpp3 1.0.1 ──
✔ tibble      3.2.1     ✔ tsibble     1.1.5
✔ dplyr       1.1.4     ✔ tsibbledata 0.4.1
✔ tidyr       1.3.1     ✔ feasts      0.4.1
✔ lubridate   1.9.4     ✔ fable       0.4.1
✔ ggplot2     3.5.1     
── Conflicts ─────────────────────────────────────────────────────── fpp3_conflicts ──
✖ lubridate::date()    masks base::date()
✖ dplyr::filter()      masks stats::filter()
✖ tsibble::intersect() masks base::intersect()
✖ tsibble::interval()  masks lubridate::interval()
✖ dplyr::lag()         masks stats::lag()
✖ tsibble::setdiff()   masks base::setdiff()
✖ tsibble::union()     masks base::union()

这表明你的 fpp3 包调用成功了。

如果继续输入下面的命令

aus_retail |> filter(`Series ID`=="A3349640L") |> autoplot(Turnover)

则会在右下面板的 Plots 中显示图表

用 R 绘制的图表

用 R 绘制的图表

4. 其他设置

  • 在启动时不读取之前操作的历史纪录。在 Tools > Global Options ...General 项目中的 Workspace 部份,取消 Restore .RData into workspace at startup 的选择。这是为了避免因忘记自己之前做过的操作而导致出现错误的结果。

  • 使用 native pipe operator |>。在 Tools > Global Options ...Code 项目中的 Editing 部份,选择 Use native pipe operator, |> (requares R 4.1 +)。此选项的作用见第二讲 slides。

使用建议

  • 在使用时将输入法切换至英文。这是因为 R 命令中经常会用到英文(半角)符号,包括逗号、引号等。例如逗号在中文输入状态下是全角符号,在显示器中和英文逗号的区别并不明显(这是英文半角逗号, 这是中文全角逗号),如果混用则会报错且不容易发现错误所在。

  • 学会利用官方提供的帮助文档。官方帮助文档提供了命令的使用方法和补充信息,是学习的一手资料。虽然一开始不太容易看懂,但是一定要养成看帮助文档的习惯。可以用 help(xxx)?xxx 调取命令 xxx 的帮助文档(xxx 可以是任何函数或数据集),或在 RStudio 的 Help 菜单中寻找其他有用信息。

  • 避免用中文命名文件或文件夹。在导入或导出数据的时候需要指示文件名和保存路径。此时如果包含中文字符,有可能出现意想不到的错误。初学阶段经验积累不够,准确定位错误原因是比较困难的,因此建议从根本上杜绝出现错误的可能性。

学习资料

练习使用 RStudio

RStudio 的官方说明文件 https://docs.posit.co/ide/user/ 提供了详细的使用方法。

零基础上手 R

如果想要快速上手 R 的使用方法,可以参考 A (very) short introduction to R (Torfs, P., & Brauer, C., August 2024)。根据作者所述,阅读并练习该文档中的所有内容大概需要 1–2 个小时。

Cheat Sheets

RStudio 的 Help 菜单里提供了一些 cheat sheets,即快速查询使用方法的指引文档,在查询未知命令时非常方便。建议保存在自己的电脑中随时查看。