Skip to content

BGE-Reranker-V2-M3 重排模型

BGE-Reranker-V2-M3 是算力舱内置的重排服务,通常用于在向量召回后对候选结果进行二次排序,提升检索精度。

服务信息

  • 服务地址:
  • 健康检查地址:
  • 镜像:registry.lazycat.cloud/x/lzc-aipod-bge-rerank:a7d1e2b

单独部署使用

  1. 将下面内容保存到一个 docker-compose.yml 文件中
yml
services:
  bgererankerv2m3vllm:
    image: registry.lazycat.cloud/x/lzc-aipod-bge-rerank:a7d1e2b
    ports:
      - 8000:8000
    environment:
      - LANGUAGE=en_US:en
      - LANG=en_US.UTF-8
      - LC_ALL=en_US.UTF-8
      - VLLM_CONFIGURE_LOGGING=0
      - VLLM_DO_NOT_TRACK=1
      - VLLM_NO_USAGE_STATS=1
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:8000/health"]
      interval: 10s
      timeout: 30s
      retries: 100
      start_period: 360s
  1. 在当前目录运行 docker-compose up -d 启动
  2. 启动后先访问 http://127.0.0.1:8000/health 确认服务健康