不管你以后做什么方向——影像、时序还是图神经网络,这个阶段的内容都要先学好。
很多同学想跳过基础直接学高级的,这样做是不对的,后面会遇到很多问题看不懂。踏踏实实把基础打好,后面学什么都快。
带你了解人工智能的发展历程,从最早的图灵测试、专家系统,到后来的神经网络、深度学习,再到现在的大模型。让你对AI这个领域有一个整体的认识,知道我们学的东西在整个体系里处于什么位置。
这节课主要是看视频听讲,不需要写代码。但是你要边看边做笔记,把关键概念用自己的话记下来。看完之后,试着给别人解释一下"神经网络是怎么学习的",如果能讲清楚,说明你理解了。
能回答这些问题就算过关:1)深度学习和传统机器学习有什么区别?2)反向传播算法的核心思想是什么?3)为什么深层网络比浅层网络效果好?
教你在自己电脑上搭建深度学习的开发环境。包括Python安装、Anaconda的使用、PyTorch的安装、CUDA和cuDNN的配置。
环境配置是新手最容易卡住的地方,很多人学了一个月还在装环境。我的建议是:严格按照视频的步骤来,不要自己乱改;遇到报错先复制错误信息去搜索,大部分问题网上都有答案;实在解决不了就截图发群里问,不要在这个环节耗太久。
这节课必须动手操作,光看视频没有用。建议先完整看一遍视频了解流程,然后跟着视频一步一步操作,每一步都要验证成功了再进行下一步。把自己的配置过程记录下来,以后换电脑或者重装系统的时候还能用。
从零开始教Python编程。包括基础语法、数据类型、函数定义、面向对象编程,以及NumPy和Pandas这两个数据处理必备的库。
如果你之前完全没学过Python,这节课要认真学,每个知识点都要敲代码练习,不能只看不练。如果你有Python基础,可以快速过一遍,重点看NumPy数组操作和Pandas数据处理,这两个后面天天要用。
一定要动手敲代码,看视频的时候老师写一行你就跟着写一行。每个知识点学完之后自己想一个小例子练习。课程里的练习题一定要做,做不出来就回去看视频。
能独立写一个简单的程序(比如学生成绩管理),能用NumPy做矩阵运算,能用Pandas读取CSV文件并做简单的数据分析。
教你传统机器学习的主要算法,包括线性回归、逻辑回归、决策树、随机森林、支持向量机、K近邻、XGBoost、LightGBM等,以及聚类、降维等无监督学习方法。
很多同学问我:我是做深度学习的,还需要学这些传统算法吗?需要的,原因有三:第一,机器学习是深度学习的基础,很多概念是相通的;第二,不是所有问题都需要深度学习,有些场景传统算法效果更好、速度更快;第三,写论文的时候,这些算法经常作为baseline进行对比。
每个算法都要做到三点:能用自己的话解释原理(不需要推公式,但要理解核心思想);能用sklearn库调用这个算法跑一个例子;知道这个算法适合什么场景、有什么优缺点。建议在鸢尾花、泰坦尼克号、房价预测这些经典数据集上把各种算法都跑一遍,对比效果。
能独立完成一个完整的机器学习项目:数据读取、数据清洗、特征工程、模型训练、模型评估、结果分析。
这是新手通识阶段最重要的一节课。教你PyTorch框架的完整使用方法,以及CNN、RNN、Transformer三大基础网络的原理和实现。学完这节课,你就正式入门深度学习了。
这节课内容多、难度大,建议至少花2到3周时间来学。不要赶进度,每个知识点都要吃透。特别是PyTorch的Dataset、DataLoader、模型定义、训练循环这些内容,后面天天要用,必须非常熟练。
PyTorch基础部分要跟着视频把每个API都敲一遍,理解每个函数的输入输出。网络部分先理解原理,再看代码实现,最后自己从头写一遍。
最重要的:一定要完成猫狗分类实战项目。这个项目包含了完整的深度学习流程:数据加载、数据增强、模型定义、训练、评估、预测。做完这个项目,你就真正会训练模型了。
恭喜你完成了新手通识阶段的学习!接下来根据你的数据类型,选择对应的实验室继续深入学习:
处理图片数据 → 影像实验室
处理时间序列数据 → 时序实验室
处理表格数据或图结构数据 → AI+实验室