nsheth

nsheth

llama-3-lumimaid-8b-v0.1-iq-imatrix

It uses this one Q4_K_M-imat (4.89 BPW) quant for up to 12288 context sizes. for less than 8gb vram

vision

3,768 Pulls 1 Tag Updated 2 years ago
llava-llama-3-8b-v1_1-int4

vision

2,132 Pulls 1 Tag Updated 2 years ago