关于时序实验室
时序实验室专门处理时间序列数据。和影像实验室不同,这里的数据是随时间变化的序列,处理方法和模型都不一样。
常见的时序数据包括:股票价格、电力负荷、传感器信号、心电图、交通流量、气象数据等。学完这个实验室,你就能独立完成时序预测、异常检测、时序分类这些任务了。
点击图片可放大查看完整课程结构
第一部分:框架拆解
通用项目结构讲解
了解深度学习时序项目的标准结构,包括数据加载、模型定义、训练循环、评估模块等。掌握通用的代码组织方式,方便后续快速复现论文。
文本与时序库代码结构讲解
学习常用时序库(如TSlib、GluonTS)的代码结构,理解如何利用现有框架快速搭建实验。
通过一个完整的时序预测项目,从数据准备到模型训练到结果评估,跑通整个流程。建立对时序项目的整体认知。
第二部分:数据处理
- 结构化数据介绍:什么是结构化数据,表格数据的特点
- 常见数据处理方式:缺失值填充、异常值处理、数据清洗
- 数据可视化:用图表直观展示数据分布和特征
- 时序数据介绍:时间序列的基本概念,采样频率、时间窗口
- 常见数据处理方式:归一化、差分、平滑、重采样
- 数据可视化:时序图、趋势图、季节性分解图
- 自相关性与偏自相关性:ACF和PACF分析,理解序列的依赖关系
重要提醒
时序数据不能随机打乱!必须按时间顺序划分训练集和测试集,否则会造成数据泄露。
- 文本数据介绍:文本数据的特点,与时序的结合场景
- 常见数据处理方式:分词、向量化、序列编码
综合运用上面学到的预处理方法,完成一个完整的数据准备流程。构建滑动窗口数据集,准备好模型训练所需的输入输出格式。
第三部分:算法讲解
- LSTM:通过门控机制解决长期依赖问题,时序预测的经典模型
- Informer:稀疏自注意力机制,高效处理长序列预测
- TCN:时序卷积网络,用因果卷积和膨胀卷积处理时序
- TimesNet:将一维时序转换为二维张量,捕捉周期性模式
- Anomaly Transformer:基于Transformer的异常检测模型,利用关联差异识别异常
- Bert:双向编码器,用于序列理解和表征学习
- GPT:自回归生成模型,用于序列生成任务
- 不同模型的优缺点:了解各模型的适用场景和局限性
- 选择合适模型方法:根据数据特点和任务需求选择最优方案
老师建议
针对自身数据类型与下游任务,选择其中一个模型跑通项目。不需要每个都深入学,先跑通一个再说。
第四部分:模型改进
- 结构化数据增强:SMOTE、数据合成等方法
- 时序数据增强:窗口切片、加噪声、时间扭曲
- 文本数据增强:回译、同义词替换、随机删除
- 结构化特征增强:特征交叉、多项式特征
- 时序特征增强:滞后特征、滚动统计特征、频域特征
- 文本特征增强:词向量、预训练嵌入
- 常见超参:学习率、批大小、隐藏层维度、层数等
- 常见的调参经验:调参顺序、搜索策略、早停技巧
- 权重剪枝:移除不重要的权重连接
- 神经元剪枝:移除不重要的神经元
- 整数量化:将浮点权重转为整数
- 低位量化:使用更少的位数表示权重
- 动态量化:运行时动态量化
- 粒子群优化算法:群体智能优化超参数
- 鲸鱼优化算法:仿生优化算法
- 调参工具Optuna:自动化超参数搜索
- 加模块:添加注意力机制、残差连接等模块
- 替换模块:用更强的模块替换原有组件
- 轻量化:知识蒸馏、模型压缩
- 全量微调:微调所有参数
- PEFT:参数高效微调(LoRA、Adapter等)
- 提示词微调:Prompt Tuning
- 数据特征工程角度:从数据和特征层面寻找创新点
- 模型自身角度:改进模型结构、融合多种模型
- 训练框架角度:改进训练策略、损失函数设计
老师建议
对于上一个作业,通过学习改进方法对模型进行改进并优化。选择1-2个改进方向深入尝试即可。
第五部分:测试与补充学习
学会设计完整的实验方案,包括对比实验、消融实验、参数敏感性分析等。掌握论文中实验部分的写作规范和图表制作。
- 论文班:论文写作、投稿流程、审稿应对
- 国际前沿:最新研究进展、顶会论文解读
时序实验室学完之后
到这里,时序实验室的核心内容就学完了。接下来你可以:
1. 根据自己的论文方向,深入学习对应的任务(预测/故障诊断/异常检测)
2. 找一个公开数据集(ETT、ECL、Weather等),完整做一个项目练手
3. 重点学习模型改进部分,为论文找创新点