bounty还有5天到期。回答此问题可获得+500声望奖励。Paul Reiners希望引起更多关注这个问题。
我使用下面的代码来加载resnet50,但由于这是一个视频。我不确定预期的输入是什么。是([batch_size, channels, frames,img1,img2])
吗?
任何帮助将是伟大的。
import pytorchvideo.models.resnet
def resnet():
return pytorchvideo.models.resnet.create_resnet(
input_channel=3, # RGB input from Kinetics
model_depth=50, # For the tutorial let's just use a 50 layer network
model_num_class=400, # Kinetics has 400 classes so we need out final head to align
norm=nn.BatchNorm3d,
activation=nn.ReLU,
)
1条答案
按热度按时间zf9nrax11#
输入Tensor的形状应为(B,C,T,H,W)
资料来源: www.example.com
文档中的一个用法示例。