ibm/granite-embedding

ibm/ granite-embedding

1,424 Downloads Updated 5 months ago

embedding 30m 107m 125m 278m

ollama pull ibm/granite-embedding:30m

curl http://localhost:11434/api/embed \
  -d '{
    "model": "ibm/granite-embedding:30m",
    "input": "Why is the sky blue?"
  }'

import ollama

response = ollama.embed(
    model='ibm/granite-embedding:30m',
    input='The sky is blue because of Rayleigh scattering',
)
print(response.embeddings)

import ollama from 'ollama'

const response = await ollama.embed({
  model: 'ibm/granite-embedding:30m',
  input: 'The sky is blue because of Rayleigh scattering',
})
console.log(response.embeddings)

Models

Name

16 models

Size

Context

Input

granite-embedding:30m

63MB · 512 context window · Text · 5 months ago

granite-embedding:30m

63MB

512

Text

granite-embedding:107m

221MB · 512 context window · Text · 5 months ago

granite-embedding:107m

221MB

512

Text

granite-embedding:125m

251MB · 512 context window · Text · 5 months ago

granite-embedding:125m

251MB

512

Text

granite-embedding:278m

563MB · 512 context window · Text · 5 months ago

granite-embedding:278m

563MB

512

Text

Readme

Granite embedding models

The IBM Granite Embedding 30M and 278M models are text-only dense bi-encoder embedding models, with 30M available in English only and 278M serving multilingual use cases. These models are designed to produce fixed length vector representations for a given text chunk, which can be used for text similarity, retrieval, and search applications.

Running

30M:

ollama run ibm/granite-embedding:30m

278M:

ollama run ibm/granite-embedding:278m

Supported Languages

30M: English 278M: English, German, Spanish, French, Japanese, Portuguese, Arabic, Czech, Italian, Korean, Dutch, Chinese (Simplified)

Granite dense models

The Granite dense models are available in 2B and 8B parameter sizes designed to support tool-based use cases and for retrieval augmented generation (RAG), streamlining code generation, translation and bug fixing.

Granite mixture of experts models

The Granite mixture of experts models are available in 1B and 3B parameter sizes designed for low latency usage.

Learn more

Release Date: December 18th, 2024
License: Apache 2.0
https://www.ibm.com/granite

<center><img src="https://ollama.com/assets/library/granite3.2/90c5e567-0004-425c-a17a-1b846c2b5d3d" data-canonical-src="https://gyazo.com/eb5c5741b6a9a16c692170a41a49c858.png" width="600" /></center>

### Granite embedding models

The IBM Granite Embedding 30M and 278M models are text-only dense bi-encoder embedding models, with 30M available in English only and 278M serving multilingual use cases. These models are designed to produce fixed length vector representations for a given text chunk, which can be used for text similarity, retrieval, and search applications.

#### Running

##### 30M:

```
ollama run ibm/granite-embedding:30m
```

##### 278M:

```
ollama run ibm/granite-embedding:278m
```

#### Supported Languages

30M: English 278M: English, German, Spanish, French, Japanese, Portuguese, Arabic, Czech, Italian, Korean, Dutch, Chinese (Simplified)

#### Granite dense models

The Granite dense models are available in 2B and 8B parameter sizes designed to support tool-based use cases and for retrieval augmented generation (RAG), streamlining code generation, translation and bug fixing.

#### Granite mixture of experts models

The Granite mixture of experts models are available in 1B and 3B parameter sizes designed for low latency usage.

---

#### Learn more

- Release Date: December 18th, 2024
- License: Apache 2.0
- https://www.ibm.com/granite

Paste, drop or click to upload images (.png, .jpeg, .jpg, .svg, .gif)