163 3 months ago

bce-reranker-base_v1是由网易有道开发的跨语种语义表征算法模型,擅长优化语义搜索结果和语义相关顺序精排,支持中英日韩四门语言,覆盖常见业务领域,支持长package rerank(512~32k)。

embedding

Models

View all →

Readme

bce-reranker-base_v1模型是一款基于XLMRoberta的句子向量编码模型,拥有中英日韩四个语种跨语种语义精排能力。一阶段检索后,该模型依次评估各文档与用户问题的相关性,输出有意义的语义相关分数。之后根据相关分数进行过滤和排序,实现对文档的选优。

二阶段检索算法结合召回和精排二者的优势,召回阶段可以快速找到用户问题相关文本片段,精排阶段可以将正确相关片段尽可能排在靠前位置,并过滤掉低质量的片段。二阶段检索可以很好地权衡检索效果和效率,具有巨大应用价值。