关于 PyTorch 在调用 CUDA 时卡退问题

在学习Windows下深度学习环境配置时,我参考了李沐老师的视频:

Windows 下安装 CUDA 和 Pytorch 跑深度学习 - 动手学深度学习v2_哔哩哔哩_bilibili

在使用Anaconda PowerShell Prompt运行PyTorch调用CUDA时,出现了程序崩溃问题

问题

在python中运行以下代码:

1
2
3
4
import torch

a = torch.ones((3,1))
a = a.cuda(0)

程序会直接退出,没有报错信息

image-20260509131509058

经过排查,问题的主要原因是CUDA / torch / Python 版本不兼容

我当前安装的是:

软件 版本
Python 3.13
CUDA Toolkit 13.2
PyTorch 最新版本

而李沐老师视频中使用的是:

软件 版本
Python 3.9
CUDA 11.8

目前深度学习生态(尤其是 PyTorch、MONAI、mmcv 等框架)对 Python 3.13 的支持还不够稳定,因此在调用 CUDA 时容易出现以下问题:

  • 程序闪退
  • CUDA 初始化失败
  • DLL 冲突
  • 无报错直接崩溃

解决方案

鉴于如今深度学习主流使用的是python3.9,我们可以通过 Anaconda 创建一个新的 Python 3.9 环境来解决问题

创建环境

1
conda create -n med python=3.9

其中med是我们要新建的环境名(可自己设定)

进入环境

1
conda activate med

进入后终端前面会显示:

1
(med)

说明已经成功进入该环境

安装PyTorch(CUDA 11.8 版本)

在新环境中执行:

1
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

安装完成进行测试:

image-20260509132224022

这样就完成了软件的搭建

常用conda命令

进入环境

1
conda activate med

查看所有环境

1
conda env list

退出当前环境

1
conda deactivate

删除环境

1
conda remove -n med --all

总结

本次问题的本质是Python 3.13 与当前深度学习生态兼容性不足,导致 PyTorch 在调用 CUDA 时发生崩溃

通过创建 Python 3.9 独立环境,并安装PyTorch + CUDA 11.8,即可稳定运行深度学习相关代码


猫猫🐱



© 2025 子非鲲 使用 Stellar 创建
共发表 40 篇 Blog · 总计 102.7k 字