介绍

AI翻译助手是一个基于大语言模型的字幕翻译工具,它可以将srt格式的英文字幕翻译为中文字幕。网站地址为AI字幕翻译助手。 该项目的代码仓库为subtitle_translation

需求分析

翻译逻辑

Step 1: 输入文件结构化

将输入文件(英文字幕)读入后使用\n\n分割字幕文件内容为字幕单元。 注意要将四行字幕转为三行字幕处理。 注意去除特效代码 <i> </i>

Step 2: 字幕单元翻译

将字幕单元中的第三行作为需要翻译的文本{en_text},将其并入如下prompt中交给大语言模型处理,得到{zh_text}

prompt = """
    你是一个字幕翻译器,需要将字幕从英文翻译为中文。直接输出翻译结果。
    需要翻译的文本为`{en_text}`。
"""

tep 3: 模型输出文本处理

由于大模型的一些限制,{zh_text} 可能会出现如下一些情况

  1. {en_text} 中存在暴力,侮辱,偏见等内容,导致大模型不能正常翻译。需要人工翻译这种字幕。
  2. 翻译文本{zh_text} 中存在一些标点符号如逗号和句号,需要用空格替代。