weizhiwang
/

LLaVA-Llama-3-8B

Text Generation

Inference Endpoints

Model card Files Files and versions Community

weizhiwang commited on Apr 21

Commit

a930042

•

1 Parent(s): d3464c5

Update README.md

Files changed (1) hide show

README.md +4 -1

README.md CHANGED Viewed

@@ -31,6 +31,7 @@ from llava.model.builder import load_pretrained_model
 from llava.mm_utils import tokenizer_image_token, process_images, get_model_name_from_path
 from PIL import Image
 import requests
 # load model and processor
 device = "cuda" if torch.cuda.is_available() else "cpu"
@@ -41,7 +42,9 @@ tokenizer, model, image_processor, context_len = load_pretrained_model(weizhiwan
 text = '<image>' + '\n' + "Describe the image."
 conv.append_message(conv.roles[0], text)
 conv.append_message(conv.roles[1], None)
-url = "https://huggingface.co/adept/fuyu-8b/resolve/main/bus.png"
 image_tensor = image_processor.preprocess(image, return_tensors='pt')['pixel_values'].half().cuda()
 # autoregressively generate text

 from llava.mm_utils import tokenizer_image_token, process_images, get_model_name_from_path
 from PIL import Image
 import requests
+from io import BytesIO
 # load model and processor
 device = "cuda" if torch.cuda.is_available() else "cpu"
 text = '<image>' + '\n' + "Describe the image."
 conv.append_message(conv.roles[0], text)
 conv.append_message(conv.roles[1], None)
+url = https://upload.wikimedia.org/wikipedia/en/thumb/7/7d/Lenna_%28test_image%29.png/330px-Lenna_%28test_image%29.png" # Lena
+response = requests.get(url)
+image = Image.open(BytesIO(response.content)).convert('RGB')
 image_tensor = image_processor.preprocess(image, return_tensors='pt')['pixel_values'].half().cuda()
 # autoregressively generate text