dengcao/bce-reranker-base

dengcao/ bce-reranker-base_v1

564 Downloads Updated 1 year ago

bce-reranker-base_v1是由网易有道开发的跨语种语义表征算法模型，擅长优化语义搜索结果和语义相关顺序精排，支持中英日韩四门语言，覆盖常见业务领域，支持长package rerank(512~32k)。

embedding

ollama pull dengcao/bce-reranker-base_v1

curl http://localhost:11434/api/embed \
  -d '{
    "model": "dengcao/bce-reranker-base_v1",
    "input": "Why is the sky blue?"
  }'

import ollama

response = ollama.embed(
    model='dengcao/bce-reranker-base_v1',
    input='The sky is blue because of Rayleigh scattering',
)
print(response.embeddings)

import ollama from 'ollama'

const response = await ollama.embed({
  model: 'dengcao/bce-reranker-base_v1',
  input: 'The sky is blue because of Rayleigh scattering',
})
console.log(response.embeddings)

Models

View all →

Name

1 model

Size / Usage

Context

Input

bce-reranker-base_v1:latest

304MB · 512 context window · Text · 1 year ago

bce-reranker-base_v1:latest

304MB

512

Text

Readme

bce-reranker-base_v1模型是一款基于XLMRoberta的句子向量编码模型，拥有中英日韩四个语种跨语种语义精排能力。一阶段检索后，该模型依次评估各文档与用户问题的相关性，输出有意义的语义相关分数。之后根据相关分数进行过滤和排序，实现对文档的选优。

二阶段检索算法结合召回和精排二者的优势，召回阶段可以快速找到用户问题相关文本片段，精排阶段可以将正确相关片段尽可能排在靠前位置，并过滤掉低质量的片段。二阶段检索可以很好地权衡检索效果和效率，具有巨大应用价值。