shaowenchen
/

llama-2-13b-langchain-chat-gguf

Text Generation

Model card Files Files and versions Community

shaowenchen commited on Sep 12, 2023

Commit

4fe9b11

·

1 Parent(s): 219f5fd

Update README.md

Files changed (1) hide show

README.md +8 -0

README.md CHANGED Viewed

@@ -41,6 +41,14 @@ tags:
 | llama-2-13b-langchain-chat.Q8_0.gguf   | Q8_0         | 13 GB  |
 | llama-2-13b-langchain-chat.gguf        | ful          | 24 GB  |
 ## Provided images
 | Name                                               | Quant method | Size    |

 | llama-2-13b-langchain-chat.Q8_0.gguf   | Q8_0         | 13 GB  |
 | llama-2-13b-langchain-chat.gguf        | ful          | 24 GB  |
+Usage:
+```bash
+docker run --rm -it -p 8000:8000 -v /path/to/models:/models -e MODEL=/models/gguf-model-name.gguf hubimage/llama-cpp-python:latest
+```
+and you can view http://localhost:8000/docs to see the swagger UI.
 ## Provided images
 | Name                                               | Quant method | Size    |