Qwen-7B-Chat-Int4 / modeling_qwen.py

Commit History

update modeling_qwen.py

348227b

yangapku commited on Dec 7, 2023

update modeling_qwen.py

68600f4

yangapku commited on Dec 6, 2023

update modeling_qwen.py

f2191b9

yangapku commited on Dec 4, 2023

update modeling_qwen.py

1e66ba4

yangapku commited on Dec 3, 2023

update

5ff8f11

yangapku commited on Nov 30, 2023

remove fix-sized causal mask

c02ede5

yangapku commited on Nov 14, 2023

add kernel file check in modeling_qwen.py

5bfdae9

yangapku commited on Nov 5, 2023

update modeling.py

8750247

yangapku commited on Oct 26, 2023

update modeling_qwen.py

6ec2d41

yangapku commited on Oct 16, 2023

update batch inference

246a75e

yangapku commited on Oct 14, 2023

softmax_in_fp32

682f4da

yangapku commited on Sep 28, 2023

update modeling_qwen.py

f6d1017

yangapku commited on Sep 27, 2023

update kernels

1581be8

yangapku commited on Sep 27, 2023

update modeling_qwen.py

fcc99d6

yangapku commited on Sep 26, 2023

update modeling_qwen.py

f4b568f

yangapku commited on Sep 25, 2023

update kvcache

0e3568a

yangapku commited on Sep 25, 2023

update readme

8afa075

yangapku commited on Sep 25, 2023

update model

ff5200f

yangapku commited on Sep 25, 2023

Commit History

update modeling_qwen.py 348227b

update modeling_qwen.py 68600f4

update modeling_qwen.py f2191b9

update modeling_qwen.py 1e66ba4

update 5ff8f11

remove fix-sized causal mask c02ede5

add kernel file check in modeling_qwen.py 5bfdae9

update modeling.py 8750247

update modeling_qwen.py 6ec2d41

update batch inference 246a75e

softmax_in_fp32 682f4da

update modeling_qwen.py f6d1017

update kernels 1581be8

update modeling_qwen.py fcc99d6

update modeling_qwen.py f4b568f

update kvcache 0e3568a

update readme 8afa075

update model ff5200f

update modeling_qwen.py

348227b

update modeling_qwen.py

68600f4

update modeling_qwen.py

f2191b9

update modeling_qwen.py

1e66ba4

update

5ff8f11

remove fix-sized causal mask

c02ede5

add kernel file check in modeling_qwen.py

5bfdae9

update modeling.py

8750247

update modeling_qwen.py

6ec2d41

update batch inference

246a75e

softmax_in_fp32

682f4da

update modeling_qwen.py

f6d1017

update kernels

1581be8

update modeling_qwen.py

fcc99d6

update modeling_qwen.py

f4b568f

update kvcache

0e3568a

update readme

8afa075

update model

ff5200f