torch torchvision transformers Pillow opencv-python numpy av qwen_vl_utils accelerate>=0.26.0