Commits · aws-neuron/optimum-neuron-cache

Update inference-cache-config/mistral.json

8ea3b57
verified

dacorvo HF staff commited on Sep 27

Update inference-cache-config/llama.json

d05f579
verified

dacorvo HF staff commited on Sep 26

Rename inference-cache-config/Llama3.1-70B.json to inference-cache-config/Llama3.1-70b.json

a92cfe3
verified

dacorvo HF staff commited on Sep 26

Update inference-cache-config/mixtral.json

7342c16
verified

dacorvo HF staff commited on Sep 26

Rename inference-cache-config/Llama-3.1-70B.json to inference-cache-config/Llama3.1-70B.json

b41e94c
verified

dacorvo HF staff commited on Sep 26

Create Llama-3.1-70B.json

b1279f9
verified

dacorvo HF staff commited on Sep 26

Delete inference-cache-config/llama3-8b.json

5b0b2de
verified

dacorvo HF staff commited on Sep 26

Update inference-cache-config/llama.json

0548cd2
verified

dacorvo HF staff commited on Sep 26

Delete inference-cache-config/llama2-7b-13b.json

219c5fd
verified

dacorvo HF staff commited on Sep 26

Update inference-cache-config/llama.json

afb9fe6
verified

dacorvo HF staff commited on Sep 26

Rename inference-cache-config/llama-3.1-8B.json to inference-cache-config/llama.json

14844a0
verified

dacorvo HF staff commited on Sep 26

Update inference-cache-config/mistral.json

6c4c814
verified

dacorvo HF staff commited on Sep 26

Create llama-3.1-8B.json

320841a
verified

dacorvo HF staff commited on Sep 26

Update inference-cache-config/llama3-8b.json

de9e259
verified

dacorvo HF staff commited on Sep 26

Update inference-cache-config/llama3-70b.json

5694f75
verified

dacorvo HF staff commited on Sep 26

Update inference-cache-config/stable-diffusion.json

5272eb2
verified

Jingya HF staff commited on Sep 24

Temporarily remove SD 1.5 from Runway

a74d412
verified

Jingya HF staff commited on Sep 2

Update inference-cache-config/llama-variants.json

e7179a3
verified

dacorvo HF staff commited on Jun 27

Rename inference-cache-config/llama2.json to inference-cache-config/llama2-7b-13b.json

be28bda
verified

dacorvo HF staff commited on Jun 27

Create llama2-70b.json

6fe6ee4
verified

dacorvo HF staff commited on Jun 27

Rename inference-cache-config/llama3.json to inference-cache-config/llama3-8b.json

06bc70d
verified

dacorvo HF staff commited on Jun 27

Create llama3-70b.json

2695ea9
verified

dacorvo HF staff commited on Jun 27

Create mixtral.json

57652e6
verified

dacorvo HF staff commited on Jun 6

Add more batch_size for mistral on smaller instances

545cd4d
verified

dacorvo HF staff commited on May 31

Update Mistral cached configurations

ee458f5
verified

dacorvo HF staff commited on May 31

Use princeton-nlp/Sheared-LLaMA-1.3B as a test model

695b341
verified

dacorvo HF staff commited on May 30

Remove llama2 7B config for 24 cores

17e7257
verified

dacorvo HF staff commited on May 15

Update inference-cache-config/llama3.json

5d8c4f2
verified

dacorvo HF staff commited on May 13

Update inference-cache-config/llama3.json

f5aae68
verified

dacorvo HF staff commited on Apr 20

Create llama3.json

f93cadb
verified

dacorvo HF staff commited on Apr 19

Rename inference-cache-config/llama.json to inference-cache-config/llama2.json

f06a55a
verified

dacorvo HF staff commited on Apr 19

Add more gpt2 configurations

3fbf810
verified

dacorvo HF staff commited on Apr 9

Add more llama config

2d87237
verified

dacorvo HF staff commited on Apr 9

Add Mistral-v2

20e585f
verified

dacorvo HF staff commited on Apr 9

Create stable-diffusion.json (#43)

32561fe
verified

philschmid HF staff

Jingya HF staff commited on Apr 4

Remove SalesForce embedding model

1cd13f9
verified

dacorvo HF staff commited on Mar 25

Add Zephyr to mistral variants

9164704
verified

dacorvo HF staff commited on Mar 21

Remove variants from main mistral config

ef07aca
verified

dacorvo HF staff commited on Mar 21

Add mistral most popular variants

d3983e8
verified

dacorvo HF staff commited on Mar 21

Add most popular llama variants

594abb2
verified

dacorvo HF staff commited on Mar 21

Added teknium/OpenHermes-2.5-Mistral-7B

1518247
verified

dacorvo HF staff commited on Mar 8

Added Llama-70b batch_size 4 to inference cache

593822e
verified

dacorvo HF staff commited on Mar 8

Create mistral.json

b5d0afd
verified

philschmid HF staff commited on Mar 5

Create gpt2.json

3bdb891
verified

philschmid HF staff commited on Mar 5

Create inference-cache-config/llama.json

1960ccb
verified

philschmid HF staff commited on Mar 5

Commit History

Update inference-cache-config/mistral.json 8ea3b57 verified

Update inference-cache-config/llama.json d05f579 verified

Rename inference-cache-config/Llama3.1-70B.json to inference-cache-config/Llama3.1-70b.json a92cfe3 verified

Update inference-cache-config/mixtral.json 7342c16 verified

Rename inference-cache-config/Llama-3.1-70B.json to inference-cache-config/Llama3.1-70B.json b41e94c verified

Create Llama-3.1-70B.json b1279f9 verified

Delete inference-cache-config/llama3-8b.json 5b0b2de verified

Update inference-cache-config/llama.json 0548cd2 verified

Delete inference-cache-config/llama2-7b-13b.json 219c5fd verified

Update inference-cache-config/llama.json afb9fe6 verified

Rename inference-cache-config/llama-3.1-8B.json to inference-cache-config/llama.json 14844a0 verified

Update inference-cache-config/mistral.json 6c4c814 verified

Create llama-3.1-8B.json 320841a verified

Update inference-cache-config/llama3-8b.json de9e259 verified

Update inference-cache-config/llama3-70b.json 5694f75 verified

Update inference-cache-config/stable-diffusion.json 5272eb2 verified

Temporarily remove SD 1.5 from Runway a74d412 verified

Update inference-cache-config/llama-variants.json e7179a3 verified

Rename inference-cache-config/llama2.json to inference-cache-config/llama2-7b-13b.json be28bda verified

Create llama2-70b.json 6fe6ee4 verified

Rename inference-cache-config/llama3.json to inference-cache-config/llama3-8b.json 06bc70d verified

Create llama3-70b.json 2695ea9 verified

Create mixtral.json 57652e6 verified

Add more batch_size for mistral on smaller instances 545cd4d verified

Update Mistral cached configurations ee458f5 verified

Use princeton-nlp/Sheared-LLaMA-1.3B as a test model 695b341 verified

Remove llama2 7B config for 24 cores 17e7257 verified

Update inference-cache-config/llama3.json 5d8c4f2 verified

Update inference-cache-config/llama3.json f5aae68 verified

Create llama3.json f93cadb verified

Rename inference-cache-config/llama.json to inference-cache-config/llama2.json f06a55a verified

Add more gpt2 configurations 3fbf810 verified

Add more llama config 2d87237 verified

Add Mistral-v2 20e585f verified

Create stable-diffusion.json (#43) 32561fe verified

Remove SalesForce embedding model 1cd13f9 verified

Add Zephyr to mistral variants 9164704 verified

Remove variants from main mistral config ef07aca verified

Add mistral most popular variants d3983e8 verified

Add most popular llama variants 594abb2 verified

Added teknium/OpenHermes-2.5-Mistral-7B 1518247 verified

Added Llama-70b batch_size 4 to inference cache 593822e verified

Create mistral.json b5d0afd verified

Create gpt2.json 3bdb891 verified

Create inference-cache-config/llama.json 1960ccb verified

Update inference-cache-config/mistral.json

8ea3b57
verified

Update inference-cache-config/llama.json

d05f579
verified

Rename inference-cache-config/Llama3.1-70B.json to inference-cache-config/Llama3.1-70b.json

a92cfe3
verified

Update inference-cache-config/mixtral.json

7342c16
verified

Rename inference-cache-config/Llama-3.1-70B.json to inference-cache-config/Llama3.1-70B.json

b41e94c
verified

Create Llama-3.1-70B.json

b1279f9
verified

Delete inference-cache-config/llama3-8b.json

5b0b2de
verified

Update inference-cache-config/llama.json

0548cd2
verified

Delete inference-cache-config/llama2-7b-13b.json

219c5fd
verified

Update inference-cache-config/llama.json

afb9fe6
verified

Rename inference-cache-config/llama-3.1-8B.json to inference-cache-config/llama.json

14844a0
verified

Update inference-cache-config/mistral.json

6c4c814
verified

Create llama-3.1-8B.json

320841a
verified

Update inference-cache-config/llama3-8b.json

de9e259
verified

Update inference-cache-config/llama3-70b.json

5694f75
verified

Update inference-cache-config/stable-diffusion.json

5272eb2
verified

Temporarily remove SD 1.5 from Runway

a74d412
verified

Update inference-cache-config/llama-variants.json

e7179a3
verified

Rename inference-cache-config/llama2.json to inference-cache-config/llama2-7b-13b.json

be28bda
verified

Create llama2-70b.json

6fe6ee4
verified

Rename inference-cache-config/llama3.json to inference-cache-config/llama3-8b.json

06bc70d
verified

Create llama3-70b.json

2695ea9
verified

Create mixtral.json

57652e6
verified

Add more batch_size for mistral on smaller instances

545cd4d
verified

Update Mistral cached configurations

ee458f5
verified

Use princeton-nlp/Sheared-LLaMA-1.3B as a test model

695b341
verified

Remove llama2 7B config for 24 cores

17e7257
verified

Update inference-cache-config/llama3.json

5d8c4f2
verified

Update inference-cache-config/llama3.json

f5aae68
verified

Create llama3.json

f93cadb
verified

Rename inference-cache-config/llama.json to inference-cache-config/llama2.json

f06a55a
verified

Add more gpt2 configurations

3fbf810
verified

Add more llama config

2d87237
verified

Add Mistral-v2

20e585f
verified

Create stable-diffusion.json (#43)

32561fe
verified

Remove SalesForce embedding model

1cd13f9
verified

Add Zephyr to mistral variants

9164704
verified

Remove variants from main mistral config

ef07aca
verified

Add mistral most popular variants

d3983e8
verified

Add most popular llama variants

594abb2
verified

Added teknium/OpenHermes-2.5-Mistral-7B

1518247
verified

Added Llama-70b batch_size 4 to inference cache

593822e
verified

Create mistral.json

b5d0afd
verified

Create gpt2.json

3bdb891
verified

Create inference-cache-config/llama.json

1960ccb
verified