File size: 2,149 Bytes

cbed26c
 
 
 
 
 
4deb1ca
cbed26c
 
4deb1ca
 
cbed26c
4deb1ca
cbed26c
4deb1ca
 
cbed26c
4deb1ca
cbed26c
 
4deb1ca
 
cbed26c
4deb1ca
 
 
 
 
cbed26c
 
 
 
 
4deb1ca
cbed26c
 
4deb1ca
 
cbed26c
4deb1ca
cbed26c
4deb1ca
 
cbed26c
4deb1ca
cbed26c
 
4deb1ca
 
 
cbed26c
4deb1ca
 
 
 
 
cbed26c
 
 
 
 
4deb1ca
cbed26c
 
4deb1ca
 
cbed26c
4deb1ca
cbed26c
4deb1ca
 
cbed26c
4deb1ca
cbed26c
 
4deb1ca
 
cbed26c
4deb1ca
 
 
 
 
cbed26c

{
    "per_channel": true,
    "reduce_range": true,
    "per_model_config": {
        "decoder_model": {
            "op_types": [
                "Div",
                "Squeeze",
                "Reshape",
                "Transpose",
                "Softmax",
                "Gather",
                "Mul",
                "Unsqueeze",
                "Slice",
                "Sqrt",
                "Sub",
                "Concat",
                "Range",
                "MatMul",
                "ReduceMean",
                "Shape",
                "Where",
                "Cast",
                "Add",
                "Constant",
                "Tanh",
                "Pow"
            ],
            "weight_type": "QInt8"
        },
        "decoder_model_merged": {
            "op_types": [
                "Div",
                "Squeeze",
                "Reshape",
                "Transpose",
                "Softmax",
                "Gather",
                "Mul",
                "Unsqueeze",
                "Slice",
                "Sqrt",
                "Sub",
                "Concat",
                "Range",
                "MatMul",
                "If",
                "ReduceMean",
                "Shape",
                "Where",
                "Cast",
                "Add",
                "Constant",
                "Tanh",
                "Pow"
            ],
            "weight_type": "QInt8"
        },
        "decoder_with_past_model": {
            "op_types": [
                "Div",
                "Squeeze",
                "Reshape",
                "Transpose",
                "Softmax",
                "Gather",
                "Mul",
                "Unsqueeze",
                "Slice",
                "Sqrt",
                "Sub",
                "Concat",
                "Range",
                "MatMul",
                "ReduceMean",
                "Shape",
                "Where",
                "Cast",
                "Add",
                "Constant",
                "Tanh",
                "Pow"
            ],
            "weight_type": "QInt8"
        }
    }
}