Tidyverse玩转数据练习题-初级

tidyverse
Author

Lee

Published

June 14, 2024

1 数据生成

1.1 生成随机数:生成20个0~100的随机数,并创建数据框

1.2 生成等差数:生成20个0~100的固定步长的数,并创建数据框

1.3 生成制定分布随机数:生成20个标准正态分布的随机数,并创建数据框

1.4 合并数据:将以上三个数据框按行合并为新数据框

1.5 合并数据:将以上三个数据框按列合并为新数据框df

1.6 查看数据:查看df中所有数据的最小值、最大值及百分位数

1.7 修改列名:修改df中列名为col1col2col3

1.8 数据操作:提取在第1列中且不在第2列中的数

1.9 数据操作:提取在第1列和第2列中出现频率最高的3个数

1.10 数据操作:提取第1列中可以整除5的数的位置

1.11 数据计算:计算第1列的1阶差分

1.12 数据操作:将col1col2col3顺序颠倒

1.13 数据操作:提取第1列位置在1、10、15的数

1.14 数据操作:查找第1列的局部最大值的位置

1.15 数据计算:按行计算df每一行的均值

1.16 数据计算:对第 2 列计算步长为 3 的移动平均值

1.17 数据操作:按第 3 列值的大小升序排列

1.18 数据操作:将第 1 列大于 50 的数修改为”高”,小于50的数修改为”低”

1.19 数据计算:计算低1列与第2列的欧式距离

2 高级

2.1 数据读取:从 csv 文件中读取指定数据:读取前 10 行, positionName 和 salary 列

2.2 数据读取:从 csv 文件中读取数据,将薪资大于 10000 的改为 “高”

2.3 数据操作:从 df 中对薪资水平每隔 20 行进行抽样

2.4 数据操作:取消使用科学记数法

2.5 数据操作:将上一题的数据转换为百分数

2.6 数据操作:查找上一题数据中第 3 大值的行号

2.7 数据操作:反转df的行

2.8 数据连接:全连接:根据多列匹配合并数据,保留 df1 和 df2 的观测

2.9 数据连接:左连接:根据多列匹配合并数据,只保留df1的观测

2.10 数据处理:再次读取数据1并显示所有列

2.11 数据操作:查找 secondType 与 thirdType 值相等的行号

2.12 数据操作:查找薪资大于平均薪资的第 3 个数据

2.13 数据操作:将上一题数据的 salary 列开根号

2.14 数据操作:将上一题数据的 linestation 列按 _ 拆分

2.15 数据查看:查看上一题数据一共有多少列

2.16 数据操作:提取 industryField 列以” 数据” 开头的行

2.17 数据分组汇总:以 salary score 和 positionID 做数据透视表

2.18 数据分组汇总:同时对 salary、 score 两列进行汇总计算

2.19 数据分组汇总:同时对不同列进行不同的汇总计算:对 salary 求平均,对 score 求和

2.20 数据分组汇总:计算并提取平均薪资最高的区