duckyblender/tinystories-656k/model

duckyblender/

Experimental model for generating stories with only 656K parameters!

117 Pulls Updated 8 months ago

model

e06e68395e91 · 749kB

Metadata

general.architecture

llama

llama
general.file_type

7

7
general.name

TinyStories-656K

TinyStories-656K
general.quantization_version

2

2
llama.attention.head_count

8

8
llama.attention.head_count_kv

4

4
llama.attention.layer_norm_rms_epsilon

1e-06

1e-06
llama.block_count

2

2
llama.context_length

512

512
llama.embedding_length

128

128
llama.feed_forward_length

384

384
llama.rope.dimension_count

16

16
llama.rope.freq_base

10000

10000
llama.vocab_size

2048

2048
tokenizer.ggml.add_bos_token

true

true
tokenizer.ggml.add_eos_token

false

false
tokenizer.ggml.bos_token_id

1

1
tokenizer.ggml.eos_token_id

2

2
tokenizer.ggml.model

llama

llama
tokenizer.ggml.padding_token_id

0

0
tokenizer.ggml.pre

default

default
tokenizer.ggml.scores

[-1000, -1000, -1000, -1000, -1000, ...]

[-1000, -1000, -1000, -1000, -1000, ...]
tokenizer.ggml.token_type

[3, 3, 3, 1, 1, ...]

[3, 3, 3, 1, 1, ...]
tokenizer.ggml.tokens

[<unk>, <|start_story|>, <|end_story|>, , !, ...]

[<unk>, <|start_story|>, <|end_story|>, , !, ...]
tokenizer.ggml.unknown_token_id

0

0

Tensor

blk.0

blk.1