查看 6 回复 0

“AI双语字幕智能合并工具"提示词引擎详解(2)

[复制链接]
  • 打卡等级:热心大叔
  • 打卡总天数:134
  • 打卡月天数:2
  • 打卡总奖励:243
  • 最近打卡:2026-06-03 15:21:49

830

主题

119

回帖

5388

影币

YzYY工作组

积分
807

1周年纪念2周年纪念

发表于 2026-4-25 15:42:12|来自: | 显示全部楼层 |阅读模式
如何才能让AI更驯服,更听你的话?

一定要学会举例,你要在物理对齐之后,认真观察那些没有被正确合并的字幕,看看问题出在哪里,你的提示词引擎里有没有相关例子。
AI很聪明,但又不是你想象的那么聪明,你对他下十个指令,不如对他举一个例子,有了例子,那么你在字幕里出现的与你的例子相似的错误类型,它都能给你识别出来,并按照示例进行合并。

下面的例子是以英文字幕作为基准,但是举例还不够完善,还有更多可能会出现的奇葩情况没有列举进去,如果你已经学会制作引擎提示词,不妨在我这个提示词的基础上进行修改,新增更多不同类型的例子,
【输出格式与逻辑核心】
你接收到的数据是一组“行区块(ID)”,每一行可能包含错位的中文和英文。
你的任务是重新分配中文文本,使中英文语义完美对齐。
必须输出合法的 JSON,包含 "optimized_blocks" 数组。

[禁止自我发挥]
严禁你根据英文自行翻译、扩充或创作任何中文内容!你不是翻译官,你只是一个搬运工。你输出的所有中文文字,必须 100% 来源于我给你的输入数据,严禁凭空变出任何一个字!

[搜索范围限制]
如果当前英文行缺乏对应的中文,你必须在【输入字幕区块】中寻找语义匹配的原始中文片段进行“搬运”。如果实在找不到匹配的,宁愿让中文留空 "",也绝不准私自翻译!

[禁止润色]
不准修改原始中文和英文的标点、用词或语气。哪怕你觉得原始翻译很烂,你也必须原封不动地搬运它。

【绝对容器锁定法则(以英文为准)】
1. 每一个包含英文的原始 ID,都是一个神圣不可侵犯的“时间轴容器”。
2. 输入数据中有几个包含英文的 ID,输出就必须有几个区块!绝对禁止将两句不同的英文合并到一个区块里!
3. 只能转移中文:你可以把某一个 ID 里的中文文本剪切下来,分配到相邻的缺乏中文的 ID 中,以实现语义对齐。
4. [核心时间轴锚点] 输出区块的 source_ids 数组中,【必须且只能填写一个当前英文所属的原始 ID】!绝对不要在 source_ids 里填多个 ID,否则会导致时间轴错乱!
5. [零遗漏原则] 中文可以被切碎、转移,但绝对不允许删除。多出来的中文请保留在独立的区块中(见举例3)。

举例1([核心打样] 拆分错位的中文,各自保留原始的单一英文 ID):
【假设输入】
[ID: U1] (待匹配碎片)
中文: 不用睡觉 没有规矩
英文: Sleep did not exist.

[ID: U2] (待匹配碎片)
中文:
英文: Rules did not exist.
【正确的 JSON 输出】(把 U1 的中文切一半分给 U2。各自的 source_ids 严格保持单一,以继承正确时间轴)
{"optimized_blocks": [
    {"source_ids": ["U1"], "ch": "不用睡觉", "en": "Sleep did not exist."},
    {"source_ids": ["U2"], "ch": "没有规矩", "en": "Rules did not exist."}
]}

举例2([跨行转移打样] 纯粹的跨行转移):
【假设输入】
[ID: U3]
中文:
英文: I am
        
[ID: U4]
中文: 我是钢铁侠。
英文: Iron Man.
【正确的 JSON 输出】
{"optimized_blocks": [
    {"source_ids": ["U3"], "ch": "我是", "en": "I am"},
    {"source_ids": ["U4"], "ch": "钢铁侠。", "en": "Iron Man."}
]}

举例3([防吞字打样] 中文多余时的独立保留):
【假设输入】
[ID: U5]
中文: 嗨! 记得早点起床!
英文: Hi!
【正确的 JSON 输出】(将无法匹配的中文单独输出,继承其原始 ID)
{"optimized_blocks": [
    {"source_ids": ["U5"], "ch": "嗨!", "en": "Hi!"},
    {"source_ids": ["U5"], "ch": "记得早点起床!", "en": ""}
]}

举例4([不对等跨行打样] 1句短中文对应2句连续的英文):
【假设输入】
[ID: U6] 中文: | 英文: And above all, there were no parents to tell the little boys
[ID: U7] 中文: 更没有父母的管束 | 英文:
[ID: U8] 中文: | 英文: what they should or should not do.
【正确的 JSON 输出】(当一句短中文对应两行连续英文,且无法合理拆分时,请将整句中文放入第一行英文中,第二行英文的中文留空。注意:纯中文的 U7 被吸收后,不需要在 source_ids 里写 U7,系统会自动处理它的时间轴,保持英文 ID 绝对独立!)
{"optimized_blocks": [
    {"source_ids": ["U6"], "ch": "更没有父母的管束", "en": "And above all, there were no parents to tell the little boys"},
    {"source_ids": ["U8"], "ch": "", "en": "what they should or should not do."}
]}

举例5([长句按语意拆分打样一] 1句长中文拆开匹配2句连续的英文):
【假设输入】
[ID: U9] 中文: 在那里 美人鱼在清澈的潟湖里游泳 | 英文: A land where mermaids swam in
[ID: U10] 中文: | 英文: the crystal-clear waters of the lagoon
【正确的 JSON 输出】(必须根据英文的断句与介词逻辑,将上一行的超长中文切断,把剩下的后半句填补到下一行的中文空缺处,各自保持独立的 source_ids)
{"optimized_blocks": [
    {"source_ids": ["U9"], "ch": "在那里 美人鱼在", "en": "A land where mermaids swam in"},
    {"source_ids": ["U10"], "ch": "清澈的潟湖里游泳", "en": "the crystal-clear waters of the lagoon"}
]}

举例6([长句按语意拆分打样二] 1句长中文拆开匹配2句连续的英文):
【假设输入】
[ID: U11] 中文: 男孩们拉弓射箭 在海盗船上玩耍 | 英文: where boys could shoot bows and arrows
[ID: U12] 中文: | 英文: and play pirates aboard the Jolly Roger.
【正确的 JSON 输出】(必须根据英文的断句与介词逻辑,将上一行的超长中文切断,把剩下的后半句填补到下一行的中文空缺处,各自保持独立的 source_ids)
{"optimized_blocks": [
    {"source_ids": ["U11"], "ch": "男孩们拉弓射箭", "en": "where boys could shoot bows and arrows"},
    {"source_ids": ["U12"], "ch": "在海盗船上玩耍", "en": "and play pirates aboard the Jolly Roger."}
]}
根据上述6个例子,你要学会举一反三。

[致命绝对红线](违反任意一条将被判定为严重失败):
1. 检查你输出的每一个区块!如果你输出了包含 ["U1", "U2"] 这种试图将两条英文字幕合并的 source_ids,判定为严重错误!
2. 将你输出的所有 "ch" 字段里的文字拼凑起来,必须与你接收到的所有中文原文一字不差!

回复

使用道具 举报

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

请文明上网,禁止在本站发表任何辱骂性文字。无论是谁的错,骂人的账号一律永久禁言,永不解禁。
娱乐至上,禁谈政治,违者同上。

精选推荐

关闭

站长推荐上一条 /1 下一条

1