166.4K Downloads Updated 1 year ago
The text embedding set trained by Jina AI.
The easiest way to starting using jina-embeddings-v2-base-de
is to use Jina AI’s Embedding API.
jina-embeddings-v2-base-de
is a German/English bilingual text embedding model supporting 8192 sequence length.
It is based on a BERT architecture (JinaBERT) that supports the symmetric bidirectional variant of ALiBi to allow longer sequence length.
We have designed it for high performance in mono-lingual & cross-lingual applications and trained it specifically to support mixed German-English input without bias.
Additionally, we provide the following embedding models:
jina-embeddings-v2-base-de
ist ein zweisprachiges Text Embedding Modell für Deutsch und Englisch,
welches Texteingaben mit einer Länge von bis zu 8192 Token unterstützt.
Es basiert auf der adaptierten Bert-Modell-Architektur JinaBERT,
welche mithilfe einer symmetrische Variante von ALiBi längere Eingabetexte erlaubt.
Wir haben, das Model für hohe Performance in einsprachigen und cross-lingual Anwendungen entwickelt und speziell darauf trainiert,
gemischte deutsch-englische Eingaben ohne einen Bias zu kodieren.
In ollama hub we provide the following set of models:
jina-embeddings-v2-small-en
: 33 million parameters.jina-embeddings-v2-base-en
: 137 million parameters.jina-embeddings-v2-base-de
: German-English Bilingual embeddings. (you are here).jina-embeddings-v2-base-es
: Spanish-English Bilingual embeddings.This model is an embedding model, meaning it can only be used to generate embeddings.
You can get it by doing ollama pull jina/jina-embeddings-v2-base-de
curl http://localhost:11434/api/embeddings -d '{
"model": "jina/jina-embeddings-v2-base-de",
"prompt": "Wie ist das Wetter heute?"
}'
ollama.embeddings(model='jina/jina-embeddings-v2-base-de', prompt='Wie ist das Wetter heute?')
ollama.embeddings({ model: 'jina/jina-embeddings-v2-base-de', prompt: 'Wie ist das Wetter heute?' })
According to the latest blog post from LLamaIndex,
In summary, to achieve the peak performance in both hit rate and MRR, the combination of OpenAI or JinaAI-Base embeddings with the CohereRerank/bge-reranker-large reranker stands out.