实验室电脑1080Ti CUDA11.3
在跑模型的时候遇见了这个问题,首先根据调用发现问题出在一个矩阵乘法上,是一个(200,256)*(256,200),感觉不像显存炸了。
试着在网上找解决方案,找到这个博客
然而并不能解决我的问题
google了一下,发现了这个issue
于是改用conda而不是pip重装了torch,之后就解决了。
实验室电脑1080Ti CUDA11.3
在跑模型的时候遇见了这个问题,首先根据调用发现问题出在一个矩阵乘法上,是一个(200,256)*(256,200),感觉不像显存炸了。
试着在网上找解决方案,找到这个博客
然而并不能解决我的问题
google了一下,发现了这个issue
于是改用conda而不是pip重装了torch,之后就解决了。