Quark Quantized ONNX LLMs for Ryzen AI 1.3 EA - a amd Collection

amd 's Collections

AMD-RyzenAI-Deepseek-R1-Distill-Hybrid

AMD-RyzenAI-Deepseek-R1-Distill-NPU

RyzenAI-1.3_LLM_NPU_Models

RyzenAI-1.3_LLM_Hybrid_Models

quark_awq_g128_int4_asym_fp16_onnx_dml

Quark Quantized INT8 Models

AMD Nitro Diffusion

Quark Quantized Diffusion Models

Quark Quantized ONNX LLMs for Ryzen AI 1.3 EA

Quark Quantized OCP FP8 Models

Quark ONNX: int8 Quantized Models

Quark Quantized INT4 Models

Quark Quantized INT4 ONNX Models

Quark Quantized ONNX LLMs for Ryzen AI 1.3 EA

updated Oct 9, 2024

ONNX Runtime generate() API based models quantized by Quark and optimized for Ryzen AI Strix Point NPU