Skip to content

Latest commit

 

History

History
65 lines (37 loc) · 2.3 KB

File metadata and controls

65 lines (37 loc) · 2.3 KB

uv

Or, install the package into the active environment (e.g. conda):

uv sync --active --inexact

wsl 安装cuda

wsl2只是虚拟机底层,还要去应用商店下载ubuntu系列。安装完wsl的ubuntu 后,再去docker-desktop中设置,把引擎改为ubuntu。 wsl2就是一个虚拟机,但能获取硬件资源。 没有wsl2的docker是用windows的docker引擎,和nv那些基于linux的原版docker镜像不兼容的。

pip

几个常用的参数:

-U, --upgrade 
--no-index # 可以禁用pypi 
-e, --editable <path/url> #Install a project in editable mode 

https://packaging.python.org/en/latest/guides/distributing-packages-using-setuptools/#working-in-development-mode 怎么可编辑模式

把egg info删除了, pip list就找不到了. pip安装的包,会以egg或者wheel文件的放在site-package里,egg本质是个zip包,内部的C++会编译成.so文件

Conda

conda list 不能识别pip安装的软件.

mamba会快很多.

https://carpentries-incubator.github.io/introduction-to-conda-for-data-scientists/ conda 从入门到入土.

因为 V100 编译的二进制机器码不能在A100上跑. 用nvcc编译CUDA需要指定架构号. 所以还是要用和别人一模一样的设备. GPU的架构 -> 驱动 -> CUDA tool kit -> nvcc -> pytorch

Nvidia driver

cat /proc/driver/nvidia/version
sudo dmesg 查看是否lib和kernel不匹配
cat /sys/module/nvidia/version
dpkg -l nvidia-*|grep ^ii ii就是安装了的
apt list | grep nvidia-container-toolkit # 查看是否安装toolkit, 有[installed]就是安装了.

sudo apt-get --purge remove "*nvidia*"删除了所有. 不然会报错.

直接安装 nvidia-container-toolkit, 会把driver 自动装了. https://docs.nvidia.com/datacenter/cloud-native/container-toolkit/install-guide.html

https://askubuntu.com/questions/1436506/how-to-resolve-unmet-dependencies-error-when-upgrading-depends-nvidia-kernel-c 有这个问题. 根据这个网址的第一个回答可以显示nvidia-smi , 但是不能成功docker . 多重启几次.

nvidia-smi 报错:Failed to initialize NVML: Driver/library version mismatch - endRuz的文章 - 知乎 https://zhuanlan.zhihu.com/p/443208000

export $LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH
确认path有/usr/local/cuda/bin