精准翻译(大语言模型)
算力舱中内置了一个优化过的高性能大语言模型,专门用于高质量翻译任务,能够提供准确、流畅、符合语境的翻译结果,特别适合对翻译质量要求较高的场景。微服中的应用可以通过算力舱暴露的 trans API 直接调用该服务。
模型特点
- 高质量翻译:基于大语言模型,提供准确且符合语境的翻译
- 多语言支持:支持主流语言之间的相互翻译
- 灵活配置:支持自定义翻译要求,如语言对、翻译风格等
- 兼容性强:完全兼容 OpenAI API 格式,易于集成
- 高性能部署:基于 vLLM 框架优化部署,响应速度快
- 优秀基础模型:基于 Qwen3 模型,翻译任务效果优秀
服务信息
- API 地址:
- OpenAI 兼容地址:
- 默认模型名:
aipod-trans(当前版本指向 Qwen3 模型,推荐使用此别名aipod-trans方便 API 调用和后续无感升级) - 响应模式:支持流式和非流式响应
- 自定义配置:支持通过 system prompt 指定翻译语言、风格等要求
单独部署使用
- 将下面内容保存到一个
docker-compose.yml文件中
yml
services:
trans:
image: registry.lazycat.cloud/x/lzc-aipod-trans:3480c9d
ports:
- 3000:3000
environment:
- LANGUAGE=en_US:en
- LANG=en_US.UTF-8
- LC_ALL=en_US.UTF-8
- VLLM_CONFIGURE_LOGGING=0
- VLLM_DO_NOT_TRACK=1
- VLLM_NO_USAGE_STATS=1
- MAX_MODEL_LEN=2048
healthcheck:
test: ["CMD", "curl", "-f", "http://localhost:3000/health"]
interval: 10s
timeout: 30s
retries: 100
start_period: 1s- 在当前目录运行
docker-compose up -d启动 - 启动后可以通过
http://127.0.0.1:3000/v1/chat/completions调用