BGE-Reranker-V2-M3 重排模型
BGE-Reranker-V2-M3 是算力舱内置的重排服务,通常用于在向量召回后对候选结果进行二次排序,提升检索精度。
服务信息
- 服务地址:
- 健康检查地址:
- 镜像:
registry.lazycat.cloud/x/lzc-aipod-bge-rerank:a7d1e2b
单独部署使用
- 将下面内容保存到一个
docker-compose.yml文件中
yml
services:
bgererankerv2m3vllm:
image: registry.lazycat.cloud/x/lzc-aipod-bge-rerank:a7d1e2b
ports:
- 8000:8000
environment:
- LANGUAGE=en_US:en
- LANG=en_US.UTF-8
- LC_ALL=en_US.UTF-8
- VLLM_CONFIGURE_LOGGING=0
- VLLM_DO_NOT_TRACK=1
- VLLM_NO_USAGE_STATS=1
healthcheck:
test: ["CMD", "curl", "-f", "http://localhost:8000/health"]
interval: 10s
timeout: 30s
retries: 100
start_period: 360s- 在当前目录运行
docker-compose up -d启动 - 启动后先访问
http://127.0.0.1:8000/health确认服务健康