TCYZ/eng:1.8m/model

TCYZ/ eng:1.8m

14 Downloads Updated 1 month ago

Our first English model.

1m 1.8m 3m

model

52100e85de5a · 7.3MB

Metadata

general.architecture

llama

llama
llama.attention.head_count

1

1
llama.attention.head_count_kv

1

1
llama.attention.layer_norm_rms_epsilon

1e-06

1e-06
llama.block_count

2

2
llama.context_length

256

256
llama.embedding_length

256

256
llama.feed_forward_length

512

512
llama.rope.dimension_count

256

256
tokenizer.ggml.bos_token_id

0

0
tokenizer.ggml.eos_token_id

2

2
tokenizer.ggml.merges

[Ġ i, Ġ a, e r, o n, s t, ...]

[Ġ i, Ġ a, e r, o n, s t, ...]
tokenizer.ggml.model

gpt2

gpt2
tokenizer.ggml.padding_token_id

1

1
tokenizer.ggml.tokens

[<s>, <pad>, </s>, <unk>, <mask>, ...]

[<s>, <pad>, </s>, <unk>, <mask>, ...]

Tensor

blk.0

blk.1