跳转至

动手学深度学习

安装环境

这里使用 WSL 配置指南 在Windows 上安装了 Ubuntu 22.04 环境

  1. 安装 Python
  2. 安装 Miniconda
    Bash
    1
    2
    3
    4
    5
    cd ~
    # (这里根据你的版本下载)
    wget https://repo.anaconda.com/miniconda/Miniconda3-py310_23.1.0-1-Linux-x86_64.sh
    chmod +x *.sh
    ./Miniconda3-py310_23.1.0-1-Linux-x86_64.sh
    
  3. 安装工具:pip install jupyter d2l torch torchvision
  4. 下载 Jupiter 记事本文件
    Bash
    1
    2
    3
    4
    5
    mkdir d2l_dir
    cd d2l_dir
    wget https://zh-v2.d2l.ai/d2l-zh.zip
    apt install unzip
    unzip d2l-zh.zip
    
  5. 下载课程幻灯片并启动
    Bash
    1
    2
    3
    4
    5
    6
    7
    # 安装一个插件
    pip install rise
    
    git clone https://github.com/d2l-ai/d2l-zh-pytorch-slides.git
    # root用户请添加参数 --allow-root
    jupyter notebook
    # 在浏览器中打开链接
    
    wsl 不需要端口转发,但如果你使用远程服务器:ssh 笔记#ssh 端口转发

04 数据操作 + 数据预处理

一些基础概念

N维数组是机器学习和神经网络的主要数据结构

  • 标量(0-d):一个数字,如 1.0
  • 向量(1-d):一维数组,如 [1.0, 2.7, 3.4]
  • 矩阵(2-d):二维数组,如 [[0, 1, 2],[3, 4, 5],[6, 7, 8]]
  • 张量表示一个由数值组成的数组,这个数组可能有多个维度

使用 jupyter 打开网页端,课件位置 d2l-zh-pytorch-slides/chapter_preliminaries/ndarray

jupyter 笔记里的代码块可以直接运行,使用运行按钮或使用 ctrl+回车 运行

这个笔记讲述了 pytorch 的基本用法,如:

Python
import torch
x = torch.range(12)

数据预处理:pandas.ipynb

讲解了如何使用 pandas 库操作 csv 数据。

其中

Python
1
2
3
inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
inputs = inputs.fillna(inputs.mean())
print(inputs)
如果报类型错误 TypeError: can only concatenate str (not "int") to str ,请改为:
Python
inputs = inputs.fillna(inputs.mean(numeric_only=True))
猜测是 pandas 版本更新导致的问题。

05 线性代数