hanwoolderink/test/model

hanwoolderink/

test:latest

177 Downloads Updated 1 year ago

for api tests

model

e06e68395e91 · 749kB

Metadata

general.architecture

llama

llama
general.file_type

Q8_0

Q8_0
llama.attention.head_count

8

8
llama.attention.head_count_kv

4

4
llama.attention.layer_norm_rms_epsilon

1e-06

1e-06
llama.block_count

2

2
llama.context_length

512

512
llama.embedding_length

128

128
llama.feed_forward_length

384

384
llama.rope.dimension_count

16

16
llama.rope.freq_base

10000

10000
llama.vocab_size

2048

2048
tokenizer.ggml.add_bos_token

true

true
tokenizer.ggml.add_eos_token

false

false
tokenizer.ggml.bos_token_id

1

1
tokenizer.ggml.eos_token_id

2

2
tokenizer.ggml.model

llama

llama
tokenizer.ggml.padding_token_id

0

0
tokenizer.ggml.pre

default

default
tokenizer.ggml.scores

[-1000, -1000, -1000, -1000, -1000, ...]

[-1000, -1000, -1000, -1000, -1000, ...]
tokenizer.ggml.token_type

[3, 3, 3, 1, 1, ...]

[3, 3, 3, 1, 1, ...]
tokenizer.ggml.tokens

[<unk>, <|start_story|>, <|end_story|>, , !, ...]

[<unk>, <|start_story|>, <|end_story|>, , !, ...]
tokenizer.ggml.unknown_token_id

0

0

Tensor

blk.0

blk.1