R 语言新手指南¶
从数据到洞察 —— 掌握 R 语言的数据分析和统计建模能力,让数据讲述故事。
教程简介¶
R 是统计学家为数据分析量身打造的语言,拥有最丰富的统计函数库和最强大的可视化生态系统(ggplot2)。它是数据科学、生物统计、金融分析等领域的首选工具。
为什么学 R?
- 统计计算之王 :内置最全面的统计函数,从 t 检验到混合效应模型
- ggplot2 可视化 :图层式语法,让数据可视化像搭积木一样灵活
- CRAN 生态 :20000+ 专业包,覆盖几乎所有数据分析场景
- RMarkdown :代码、结果、文字融为一体,一键生成分析报告
| 项目 | 内容 |
|---|---|
| 学习目标 | 掌握 R 基础语法,能独立完成数据清洗、统计分析和可视化 |
| 预计时长 | 4~6 小时 |
| 关键概念 | 向量化、数据框、ggplot2、tidyverse、统计建模 |
| 实践任务 | 完成一个数据分析项目:从原始数据到可视化报告 |
学习路径¶
本教程采用 场景驱动 的方式,每个章节围绕一个真实数据分析任务展开:
| 章节 | 场景 | 你将学会 |
|---|---|---|
| 第 1 章:你的第一次数据分析 | 分析考试成绩 | 变量、向量、数据框、基本统计 |
| 第 2 章:让数据可视化 | 制作数据图表 | ggplot2 绘图、图层语法、图表类型 |
| 第 3 章:数据清洗与变换 | 整理杂乱数据 | dplyr、tidyr、管道操作、数据重塑 |
| 第 4 章:完成数据分析报告 | 端到端项目实战 | 统计建模、RMarkdown、完整分析流程 |
快速预览¶
library(ggplot2)
# 生成数据
x <- seq(0, 2*pi, length.out = 100)
df <- data.frame(
x = rep(x, 2),
y = c(sin(x), cos(x)),
func = rep(c("sin", "cos"), each = 100)
)
# 绘制图表
ggplot(df, aes(x = x, y = y, color = func)) +
geom_line(linewidth = 1.2) +
labs(title = "正弦与余弦函数",
x = "x", y = "y",
color = "函数") +
theme_minimal()
渲染效果: 生成一张精美的折线图,蓝色和红色分别表示 sin 和 cos 曲线,带有标题、坐标轴标签和图例,使用简洁的 minimal 主题。