Skip to content

精准翻译(大语言模型)

算力舱中内置了一个优化过的高性能大语言模型,专门用于高质量翻译任务,能够提供准确、流畅、符合语境的翻译结果,特别适合对翻译质量要求较高的场景。微服中的应用可以通过算力舱暴露的 trans API 直接调用该服务。

模型特点

  • 高质量翻译:基于大语言模型,提供准确且符合语境的翻译
  • 多语言支持:支持主流语言之间的相互翻译
  • 灵活配置:支持自定义翻译要求,如语言对、翻译风格等
  • 兼容性强:完全兼容 OpenAI API 格式,易于集成
  • 高性能部署:基于 vLLM 框架优化部署,响应速度快
  • 优秀基础模型:基于 Qwen3 模型,翻译任务效果优秀

服务信息

  • API 地址
  • OpenAI 兼容地址
  • 默认模型名aipod-trans(当前版本指向 Qwen3 模型,推荐使用此别名 aipod-trans 方便 API 调用和后续无感升级)
  • 响应模式:支持流式和非流式响应
  • 自定义配置:支持通过 system prompt 指定翻译语言、风格等要求

单独部署使用

  1. 将下面内容保存到一个 docker-compose.yml 文件中
yml
services:
  trans:
    image: registry.lazycat.cloud/x/lzc-aipod-trans:3480c9d
    ports:
      - 3000:3000
    environment:
      - LANGUAGE=en_US:en
      - LANG=en_US.UTF-8
      - LC_ALL=en_US.UTF-8
      - VLLM_CONFIGURE_LOGGING=0
      - VLLM_DO_NOT_TRACK=1
      - VLLM_NO_USAGE_STATS=1
      - MAX_MODEL_LEN=2048
    healthcheck:
      test: ["CMD", "curl", "-f", "http://localhost:3000/health"]
      interval: 10s
      timeout: 30s
      retries: 100
      start_period: 1s
  1. 在当前目录运行 docker-compose up -d 启动
  2. 启动后可以通过 http://127.0.0.1:3000/v1/chat/completions 调用