上海原油期货收益率研究数据集说明
一、数据集概述
本数据集包含与上海原油期货收益率相关的多维度数据,涵盖原油期货价格、宏观经济指标、金融市场指数、供需数据以及地缘政治风险等多个方面。数据时间跨度从1990年至2026年,适用于原油期货价格预测、收益率分析和风险管理研究。
二、数据文件清单
2.1 原油期货价格数据
| 文件名 | 格式 | 数据频率 | 时间范围 | 数据量 | 说明 |
|---|---|---|---|---|---|
| 上海原油期货日交易.csv | CSV | 日度 | 2018/3/26~至今 | ~1700条 | 上海国际能源交易中心原油期货日交易数据 |
| 布兰特原油期货日交易.csv | CSV | 日度 | 2008/2/26~至今 | ~4200条 | 国际布兰特原油期货价格数据 |
| 西德州原油日交易.csv | CSV | 日度 | 2009/9/27~至今 | ~4000条 | WTI原油期货日交易数据 |
字段说明(上海原油期货):
asset: 资产代码 (COME_CRU)date: 交易日期open: 开盘价(元/桶)high: 最高价(元/桶)low: 最低价(元/桶)close: 收盘价(元/桶)volume: 成交量(手)oi: 持仓量cash: 结算价(元/桶)
字段说明(布兰特/WTI原油):
date: 交易日期open: 开盘价(美元/桶)high: 最高价(美元/桶)low: 最低价(美元/桶)price/close: 收盘价(美元/桶)volume: 成交量open_interest: 持仓量
2.2 汇率数据
| 文件名 | 格式 | 数据频率 | 时间范围 | 数据量 | 说明 |
|---|---|---|---|---|---|
| 离岸人民币日汇率.csv | CSV | 日度 | 近期数据 | ~1000条 | 美元兑离岸人民币汇率 |
| 美元人民币汇率中间价.csv | CSV | 日度 | 近期数据 | ~1000条 | 美元兑人民币中间价 |
| 美元指数.csv | CSV | 日度 | 2000/11/28~至今 | ~6000条 | 美元指数日度数据 |
字段说明:
date: 日期rate: 汇率值 /open/high/low/close: 美元指数OHLC
2.3 股票市场指数
| 文件名 | 格式 | 数据频率 | 时间范围 | 数据量 | 说明 |
|---|---|---|---|---|---|
| 上证指数.csv | CSV | 日度 | 2017/1/3~至今 | ~1800条 | 上海证券交易所综合指数 |
| 标普500指数.csv | CSV | 日度 | 1940/1/2~至今 | ~22000条 | 美国标普500指数 |
| MSCI中国指数历史数据.csv | CSV | 日度 | 近期数据 | ~500条 | MSCI中国指数 |
| MSCI全球所有国家指数历史数据.csv | CSV | 日度 | 近期数据 | ~500条 | MSCI全球ACWI指数 |
| 俄罗斯RTS指数.csv | CSV | 日度 | 1995/9/1~至今 | ~7500条 | 俄罗斯RTS股票指数 |
字段说明(上证指数/RTS指数):
Indexcd: 指数代码Trddt/Idxtrd01: 交易日期Opnidx/Idxtrd02: 开盘指数Highidx/Idxtrd03: 最高指数Lowidx/Idxtrd04: 最低指数Clsidx/Idxtrd05: 收盘指数Vol/Idxtrd06: 成交量(万股)Value/Idxtrd07: 成交金额(万元)Idxtrd08: 指数回报率(%)
字段说明(标普500):
Indexcd: 指数代码 (SPX)Trddt: 交易日期Opnidx: 开盘指数Highidx: 最高指数Lowidx: 最低指数Clsidx: 收盘指数Vol: 成份证券成交量(万股)Value: 指数回报率
字段说明(MSCI指数):
日期: 交易日期开盘: 开盘价高: 最高价低: 最低价收盘: 收盘价交易量: 交易量涨跌幅: 涨跌幅百分比
2.4 利率与债券收益率
| 文件名 | 格式 | 数据频率 | 时间范围 | 数据量 | 说明 |
|---|---|---|---|---|---|
| 10年期美国国债收益率.csv | CSV | 日度 | 1962/1/2~至今 | ~16000条 | 美国10年期国债收益率 |
| 3月期美国国债收益率.csv | CSV | 日度 | 1981/9/1~至今 | ~11000条 | 美国3个月期国债收益率 |
| 美国一年期国债到期收益率(日)_副本.csv | CSV | 日度 | 近期数据 | ~500条 | 美国1年期国债收益率 |
字段说明:
date: 日期value/rate: 收益率(%)
2.5 风险指标
| 文件名 | 格式 | 数据频率 | 时间范围 | 数据量 | 说明 |
|---|---|---|---|---|---|
| 恐慌指数.csv | CSV | 日度 | 2000/11/28~至今 | ~6000条 | VIX波动率指数 |
| 地缘政治风险指数.csv | CSV | 日度 | 1985/1/1~至今 | ~15000条 | 地缘政治风险指数(GPR) |
| 波罗的海干散货指数历史数据_副本.csv | CSV | 日度 | 近期数据 | ~500条 | BDI指数 |
字段说明(恐慌指数/VIX):
date: 日期open/high/low/close: VIX指数OHLC值
字段说明(地缘政治风险指数):
Date: 日期N10D: 文章数量(10家主流报纸)GPRD: 日度GPR指数(基准:1985-2019=100)GPRD_ACT: 日度GPR行动指数GPRD_THREAT: 日度GPR威胁指数GPRD_MA30: 30日移动平均GPRD_MA7: 7日移动平均event: 重大事件标注
字段说明(BDI指数):
日期: 日期开盘/高/低/收盘: BDI指数价格交易量: 交易量涨跌幅: 涨跌幅
2.6 原油供需数据
| 文件名 | 格式 | 数据频率 | 时间范围 | 数据量 | 说明 |
|---|---|---|---|---|---|
| API库存.xls | XLS | 周度 | 2012/3/23~2026/5/15 | 884条 | 美国API原油库存 |
| EIA美国库存原油.xls | XLS | 周度 | 1990/1/5~2026/5/15 | 2045条 | 美国EIA原油及石油产品库存 |
| 上海库存原油.xls | XLS | 日度 | 2018/4/2~2026/5/26 | 682条 | 上海INE原油期货库存 |
| 库存美国原油(包括SPR)商业原油(不包括租赁库存)周(千桶)_副本.csv | CSV | 周度 | 近期数据 | ~500条 | 美国商业原油库存 |
| 产量原油DOE同比(周)_副本.csv | CSV | 周度 | 近期数据 | ~500条 | 美国原油产量同比变化 |
| 美国原油产量.xls | XLS | 周度 | 2003/9/12~2026/5/15 | 1331条 | 美国48州原油产量 |
| 俄罗斯原油产量.xls | XLS | 月度 | 1992/1~2026/1 | 556条 | 俄罗斯石油产量 |
| 欧佩克原油产量.xls | XLS | 月度 | 2000/11~2026/4 | 453条 | OPEC原油产量 |
字段说明(库存数据):
日期: 统计日期美国API库存量:原油: API原油库存(万桶)美国:库存:原油和石油产品总量(不包括SPR): EIA库存(千桶)库存:INE中质含硫原油: 上海库存(桶)storage: 商业原油库存(千桶)
字段说明(产量数据):
日期: 统计日期产量:原油:48州: 美国48州产量(千桶/天)产量:石油:俄罗斯:当月值: 俄罗斯产量(千桶/天)产量:原油:OPEC: OPEC产量(千桶/日)rate: 产量同比变化率(%)
三、数据分类汇总
3.1 按数据类型分类
| 数据类型 | 文件数量 | 主要内容 |
|---|---|---|
| 原油期货价格 | 3 | 上海、布兰特、WTI原油期货 |
| 汇率数据 | 3 | 人民币汇率、美元指数 |
| 股票指数 | 5 | 中美俄及全球股指 |
| 利率债券 | 3 | 美国国债收益率 |
| 风险指标 | 3 | VIX、GPR、BDI |
| 供需数据 | 8 | 库存、产量数据 |
3.2 按数据频率分类
| 频率 | 文件数量 | 典型文件 |
|---|---|---|
| 日度 | 14 | 原油期货、汇率、股指、VIX |
| 周度 | 6 | API/EIA库存、美国产量 |
| 月度 | 2 | 俄罗斯、OPEC产量 |
3.3 按地理范围分类
| 范围 | 文件数量 | 主要内容 |
|---|---|---|
| 中国 | 4 | 上海原油、上证指数、人民币汇率、上海库存 |
| 美国 | 10 | WTI、EIA数据、国债、标普500、API等 |
| 国际 | 8 | 布兰特、OPEC、俄罗斯、美元指数、MSCI等 |
四、数据质量说明
4.1 数据完整性
- 大部分日度数据包含OHLC(开盘、最高、最低、收盘)完整价格信息
- 部分早期数据可能存在缺失值
- 节假日期间无交易数据
4.2 数据单位
- 原油价格:上海期货(元/桶),国际期货(美元/桶)
- 库存数据:万桶、千桶、桶(需根据具体文件确认)
- 产量数据:千桶/天 或 千桶/日
- 汇率:直接标价法(1美元=X人民币)
4.3 数据来源
- 期货交易所:上海国际能源交易中心、CME等
- 政府机构:EIA(美国能源信息署)、API、中国人民银行等
- 金融机构:MSCI、标准普尔等
五、使用建议
5.1 数据预处理
- 日期格式统一:不同文件使用不同日期格式(YYYY/MM/DD、YYYY-MM-DD等),建议统一处理
- 缺失值处理:检查并处理缺失数据,特别是节假日和周末
- 频率对齐:根据研究需要将高频数据(日度)聚合为低频数据(周度/月度)
- 单位换算:注意不同文件的单位差异,进行必要的换算
5.2 分析应用
- 收益率计算:基于收盘价计算对数收益率或简单收益率
- 相关性分析:分析原油价格与汇率、股指、风险指标的相关性
- 预测建模:利用供需数据、宏观指标构建价格预测模型
- 风险管理:结合VIX、GPR等指标进行风险评估
5.3 注意事项
- 上海原油期货2018年3月26日上市,历史数据相对较短
- 不同数据源可能存在统计口径差异
- 地缘政治事件对原油价格影响显著,建议结合GPR指数分析