Tidyverse玩转数据练习题-高级

tidyverse
Author

Lee

Published

June 14, 2024

library(tidyverse)
library(slider)
file <- "D:/Myblog/posts/action12-tidyverse-high-2024-06-14/tech/stock-market-data.rds"
dat <- read_rds(file) %>%
  as_tibble()

数据集为 “面板数据”:包含多个股票(横截面),而每个股票则有多个按照日期排序的变量(时间序列)

股票代码 symbol 和日期 date 共同组成了数据集的键,也即每个唯一的 symbol 和 date 组合决定了一个唯一的观测。

整个数据集首先按照代码 symbol 排列,其次按照日期 date 排列。

数据集中主要的变量有:

1 Part I

1.1 哪些股票的代码中包含”8”这个数字?

1.2 每天上涨和下跌的股票各有多少?

1.3 每天每个交易所上涨、下跌的股票各有多少?

1.4 沪深300成分股中,每天上涨、下跌的股票各有多少?

1.5 每天每个行业各有多少支股票?

1.6 (每天)股票数最大的行业和总成交额最大的行业是否总是同一个行业?

1.7 每天(收益率)涨幅超过5/%、跌幅超过5/%的股票各有多少?

1.8 每天涨幅前10的股票的总成交额和跌幅前10的股票的总成交额比例是多少?

1.9 每天开盘涨停的股票与收盘涨停的股票各有多少?(涨停按照收益率超过1.5%的标准计算)

1.10 每天统计最近3天出现过开盘涨停与收盘涨停的股票各有多少支?

1.11 (每支)股票每天的成交额变化率和收益率的相关性如何?

1.12 每天每个行业的总成交额变化率和行业(加权)收益率的相关性如何?

1.13 每天市场的总成交额变化率和市场(加权)收益率相关性如何?

1.14 每天市场的总成交额的变化率和所有股票收益率的(加权)标准差相关性如何?

1.15 每天每个行业的总成交额变化率和行业内股票收益率的标准差相关性如何?

2 Part II

2.1 上证50、沪深300、中证500指数成分股中,沪股和深股有多少?

2.2 上证50、沪深300、中证500指数成分股中,行业分布如何?

2.3 每天上证50、沪深300、中证500指数成分股的总成交额各是多少?

2.4 上证50、沪深300、中证500指数日收益率的历史波动率是多少?

2.5 上证50、沪深300、中证500指数日收益率的相关系数矩阵?

2.6 上证50、沪深300、去除上证50的沪深300指数日收益率的相关系数矩阵?

2.7 每天沪深300指数成分占比最大的10支股票是哪些?

2.8 各个行业的平均每日股票数量从大到小排序是什么?

2.9 每个行业每天成交额最大的一支股票代码是什么?

2.10 每个行业每天最大成交额是最小成交额的几倍?

2.11 每个行业每天成交额最大的5支股票和成交额总和是多少?

2.12 每个行业每天成交额超过该行业中股票成交额80/%分位数的股票的平均收益率是多少?

2.13 每天成交额最大的10/%的股票的平均收益率和成交额最小的10/%的股票的平均收益率的相关系数是多少?

3 Part III

3.1 每天每个股票对市场的超额收益率是多少?

3.2 每天每个股票对市场去除自身的超额收益率是多少?

3.3 每天每支股票对行业的超额收益率是多少?(类似第30题)

3.4 每天每支股票对行业去除自身的超额收益率是多少?(类似第31题)

3.5 每支股票每天对市场的超额收益率与对行业的超额收益率的相关系数如何?

3.6 每天有哪些行业的平均收益率超过市场平均收益率?

3.7 每天每个行业对市场的超额收益率是多少?

3.8 每天每个行业对去除本行业后的市场超额收益率是多少?/

4 Part IV

4.1 每天分别有多少股票是最近连续3个交易日上涨、下跌的?

4.2 每天分别有多少股票是最近连续3个交易日收益率超过当天市场平均收益率?

4.3 每天分别有多少股票是最近5个交易日中至少有4个交易日的收益率超过当天市场平均收益率?

4.4 每个月中,个股月收益超过市场月收益1倍以上的股票有哪些?

4.5 每个月中,个股月收益超过行业月收益1倍以上的股票有哪些?找出哪些股票属于不止1个行业?

4.6 每支股票的收益率对市场收益率的相关系数最高的10个股票是哪些?

4.7 每个行业日收益率的历史波动率是多少?(用日收益率计算标准差)

4.8 各个行业的日收益率的相关系数矩阵如何?

4.9 哪两个行业相关性最高、最低?

4.10 各个行业的收益率对市场收益率的相关系数由高到低排列如何?

5 Part V

5.1 每个月总成交额比上个月下降幅度最大的行业是哪个?

5.2 数据当中各支股票的最大回微幅度是多少?(最大回撒是从一个高点到低点的降幅的最大值)

5.3 每支股票的胜率是多少?(胜率是每天收益率为正数的概率)

5.4 每支股票的盈亏比是多少?(盈亏比是正收益之和与负收益之和的比值的绝对值)

5.5 市场的胜率是多少?(市场收益率为正的概率)

5.6 市场的盈亏比是多少?(市场中每支股票的市值加权正收益和市估加权负收益之比)

5.7 每个行业的胜率是多少?

5.8 每个行业的盈亏比是多少?(行业盈亏比是行业内每支股票的市值加权的正收益率和市值加权的负收益率之比)

6 Part VI

6.1 是否存在股票的月成交额超过所在行业当月中某天一天总成交额的情况?

6.2 每天每个行业编入、编出的股票各有多少?

6.3 每天每个行业内股票收益率的(加权)标准差是多少?

6.4 每天每个行业内股票收益率的(加权)标准差的相关性如何?

6.5 每天计算出成交额的z·score(减去均值除以标准差),该指标解释下一天个股超额收益率的多少比例?

6.6 每支股票的收益率和300、500指数收益率可以回归出一个截距项和2个beta,这两个beta的分布如何?

6.7 每天开盘后到最高价涨幅最大的100支股票同样也是全天(昨收到今收)涨幅最大的100支股票的比例是多少?

6.8 每天计算最近三天每天对市场的超额收益率都排进当天前100的股票有哪些?

6.9 每天计算最近三天每天对行业的超额收益率都排进当天行业前30/%的股票有哪些?

7 Part VII

7.1 如果市场收益率是市值加权收益率,那么每天超额收益率最大的10支股票是哪些?

7.2 如果市场收益率是市值加权收益率,那么每天超额收益率最大的10支股票下一天的超额收益率排名是多少?

7.3 如果市场收益率是市估加权收益率,那么每月超额收益率最大的10支股票是哪些?

7.4 如果市场收益率是市佶加权收益率,那么每月超额收益率最大的10支股票下个月的超额收益率排名是多少?

7.5 每支股票过去5天的(平均)收益率与未来1天、5天、15天的收益率的相关性如何?

7.6 每支股票过去5天的对市值加权市场收益率的(平均)超额收益率与未来1天、5天、15天的超额收益率的相关性如何?