精准翻译（大语言模型）

算力舱中内置了一个优化过的高性能大语言模型，专门用于高质量翻译任务，能够提供准确、流畅、符合语境的翻译结果，特别适合对翻译质量要求较高的场景。微服中的应用可以通过算力舱暴露的 trans API 直接调用该服务。

模型特点

高质量翻译：基于大语言模型，提供准确且符合语境的翻译
多语言支持：支持主流语言之间的相互翻译
灵活配置：支持自定义翻译要求，如语言对、翻译风格等
兼容性强：完全兼容 OpenAI API 格式，易于集成
高性能部署：基于 vLLM 框架优化部署，响应速度快
优秀基础模型：基于 Qwen3 模型，翻译任务效果优秀

服务信息

API 地址：
OpenAI 兼容地址：
默认模型名：aipod-trans(当前版本指向 Qwen3 模型，推荐使用此别名 aipod-trans 方便 API 调用和后续无感升级)
响应模式：支持流式和非流式响应
自定义配置：支持通过 system prompt 指定翻译语言、风格等要求

单独部署使用

将下面内容保存到一个 docker-compose.yml 文件中

yml

services:
  trans:
    image: registry.lazycat.cloud/x/lzc-aipod-trans:3480c9d
    ports:
      - 3000:3000
    environment:
      - LANGUAGE=en_US:en
      - LANG=en_US.UTF-8
      - LC_ALL=en_US.UTF-8
      - VLLM_CONFIGURE_LOGGING=0
      - VLLM_DO_NOT_TRACK=1
      - VLLM_NO_USAGE_STATS=1
      - MAX_MODEL_LEN=2048
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:3000/health"]
      interval: 10s
      timeout: 30s
      retries: 100
      start_period: 1s

在当前目录运行 docker-compose up -d 启动
启动后可以通过 http://127.0.0.1:3000/v1/chat/completions 调用

精准翻译（大语言模型） ​

模型特点 ​

服务信息 ​

单独部署使用 ​

精准翻译（大语言模型）

模型特点

服务信息

单独部署使用