TCYZ/eng:1m/model

TCYZ/ eng:1m

29 Downloads Updated 5 months ago

Our first English model.

1m 1.8m 3m

model

f6e5f907e246 · 4.7MB

Metadata

general.architecture

llama

llama
llama.attention.head_count

1

1
llama.attention.head_count_kv

1

1
llama.attention.layer_norm_rms_epsilon

1e-06

1e-06
llama.block_count

1

1
llama.context_length

128

128
llama.embedding_length

256

256
llama.feed_forward_length

512

512
llama.rope.dimension_count

256

256
tokenizer.ggml.bos_token_id

0

0
tokenizer.ggml.eos_token_id

2

2
tokenizer.ggml.merges

[Ġ i, Ġ a, e r, o n, s t, ...]

[Ġ i, Ġ a, e r, o n, s t, ...]
tokenizer.ggml.model

gpt2

gpt2
tokenizer.ggml.padding_token_id

1

1
tokenizer.ggml.tokens

[<s>, <pad>, </s>, <unk>, <mask>, ...]

[<s>, <pad>, </s>, <unk>, <mask>, ...]

Tensor

blk.0