library(tidyverse)

1 数据生成

1.1 生成随机数：生成20个0~100的随机数，并创建数据框

1.2 生成等差数：生成20个0~100的固定步长的数，并创建数据框

1.3 生成制定分布随机数：生成20个标准正态分布的随机数，并创建数据框

1.4 合并数据：将以上三个数据框按行合并为新数据框

1.5 合并数据：将以上三个数据框按列合并为新数据框`df`

1.6 查看数据：查看`df`中所有数据的最小值、最大值及百分位数

1.7 修改列名：修改`df`中列名为`col1`、`col2`、`col3`

1.8 数据操作：提取在第1列中且不在第2列中的数

1.9 数据操作：提取在第1列和第2列中出现频率最高的3个数

1.10 数据操作：提取第1列中可以整除5的数的位置

1.11 数据计算：计算第1列的1阶差分

1.12 数据操作：将`col1`、`col2`、`col3`顺序颠倒

1.13 数据操作：提取第1列位置在1、10、15的数

1.14 数据操作：查找第1列的局部最大值的位置

1.15 数据计算：按行计算df每一行的均值

1.16 数据计算：对第 2 列计算步长为 3 的移动平均值

1.17 数据操作：按第 3 列值的大小升序排列

1.18 数据操作：将第 1 列大于 50 的数修改为”高”，小于50的数修改为”低”

1.19 数据计算：计算低1列与第2列的欧式距离

2 高级

2.1 数据读取：从 csv 文件中读取指定数据：读取前 10 行， positionName 和 salary 列

2.2 数据读取：从 csv 文件中读取数据，将薪资大于 10000 的改为 “高”

2.3 数据操作：从 df 中对薪资水平每隔 20 行进行抽样

2.4 数据操作：取消使用科学记数法

2.5 数据操作：将上一题的数据转换为百分数

2.6 数据操作：查找上一题数据中第 3 大值的行号

2.7 数据操作：反转df的行

2.8 数据连接：全连接：根据多列匹配合并数据，保留 df1 和 df2 的观测

2.9 数据连接：左连接：根据多列匹配合并数据，只保留df1的观测

2.10 数据处理：再次读取数据1并显示所有列

2.11 数据操作：查找 secondType 与 thirdType 值相等的行号

2.12 数据操作：查找薪资大于平均薪资的第 3 个数据

2.13 数据操作：将上一题数据的 salary 列开根号

2.14 数据操作：将上一题数据的 linestation 列按 _ 拆分

2.15 数据查看：查看上一题数据一共有多少列

2.16 数据操作：提取 industryField 列以” 数据” 开头的行

2.17 数据分组汇总：以 salary score 和 positionID 做数据透视表

2.18 数据分组汇总：同时对 salary、 score 两列进行汇总计算

2.19 数据分组汇总：同时对不同列进行不同的汇总计算：对 salary 求平均，对 score 求和

2.20 数据分组汇总：计算并提取平均薪资最高的区

1 数据生成

1.1 生成随机数：生成20个0~100的随机数，并创建数据框

1.2 生成等差数：生成20个0~100的固定步长的数，并创建数据框

1.3 生成制定分布随机数：生成20个标准正态分布的随机数，并创建数据框

1.4 合并数据：将以上三个数据框按行合并为新数据框

1.5 合并数据：将以上三个数据框按列合并为新数据框df

1.6 查看数据：查看df中所有数据的最小值、最大值及百分位数

1.7 修改列名：修改df中列名为col1、col2、col3

1.8 数据操作：提取在第1列中且不在第2列中的数

1.9 数据操作：提取在第1列和第2列中出现频率最高的3个数

1.10 数据操作：提取第1列中可以整除5的数的位置

1.11 数据计算：计算第1列的1阶差分

1.12 数据操作：将col1、col2、col3顺序颠倒

1.13 数据操作：提取第1列位置在1、10、15的数

1.14 数据操作：查找第1列的局部最大值的位置

1.15 数据计算：按行计算df每一行的均值

1.16 数据计算：对第 2 列计算步长为 3 的移动平均值

1.17 数据操作：按第 3 列值的大小升序排列

1.18 数据操作：将第 1 列大于 50 的数修改为”高”，小于50的数修改为”低”

1.19 数据计算：计算低1列与第2列的欧式距离

2 高级

2.1 数据读取：从 csv 文件中读取指定数据：读取前 10 行， positionName 和 salary 列

2.2 数据读取：从 csv 文件中读取数据，将薪资大于 10000 的改为 “高”

2.3 数据操作：从 df 中对薪资水平每隔 20 行进行抽样

2.4 数据操作：取消使用科学记数法

2.5 数据操作：将上一题的数据转换为百分数

2.6 数据操作：查找上一题数据中第 3 大值的行号

2.7 数据操作：反转df的行

2.8 数据连接：全连接：根据多列匹配合并数据，保留 df1 和 df2 的观测

2.9 数据连接：左连接：根据多列匹配合并数据，只保留df1的观测

2.10 数据处理：再次读取数据1并显示所有列

2.11 数据操作：查找 secondType 与 thirdType 值相等的行号

2.12 数据操作：查找薪资大于平均薪资的第 3 个数据

2.13 数据操作：将上一题数据的 salary 列开根号

2.14 数据操作：将上一题数据的 linestation 列按 _ 拆分

2.15 数据查看：查看上一题数据一共有多少列

2.16 数据操作：提取 industryField 列以” 数据” 开头的行

2.17 数据分组汇总：以 salary score 和 positionID 做数据透视表

2.18 数据分组汇总：同时对 salary、 score 两列进行汇总计算

2.19 数据分组汇总：同时对不同列进行不同的汇总计算：对 salary 求平均，对 score 求和

2.20 数据分组汇总：计算并提取平均薪资最高的区

1.5 合并数据：将以上三个数据框按列合并为新数据框`df`

1.6 查看数据：查看`df`中所有数据的最小值、最大值及百分位数

1.7 修改列名：修改`df`中列名为`col1`、`col2`、`col3`

1.12 数据操作：将`col1`、`col2`、`col3`顺序颠倒