我要投稿

超长小说可以用AI翻译了，新型多智能体协作系统媲美人工翻译

发布日期：2024-06-27 07:03:59 浏览次数： 2469 作者：机器之心

机器翻译 (MT) 的最新进展显着提高了各个领域的翻译质量。然而，由于其复杂的语言、比喻表达和文化差异，文学文本的翻译仍然是一个艰巨的挑战。

最近，一篇题为《(Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts》的论文，提出了一种用于文学翻译的基于大型语言模型（LLM）的新型多智能体框架，并构建了一家名为 TRANSAGENTS 的虚拟出版公司（文学翻译多智能体系统）。

论文：(Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts
论文地址：https://arxiv.org/abs/2405.11804

该框架通过利用多个智能体的集体能力来反映传统的翻译出版流程，以解决复杂的翻译问题。为了评估系统的有效性，该研究还提出两种创新的评估策略：单语人类偏好（MHP）和双语 LLM 偏好（BLP）。MHP 从目标语言的单语读者的角度评估翻译质量，而 BLP 使用高级 LLM 直接将翻译与原文进行比较。

实验结果表明，人类评估者和 LLM 都更喜欢 TRANSAGENTS 的翻译，而不是人类撰写的参考翻译，特别是在需要特定领域知识的情况下。

多智能体虚拟公司 ——TRANSAGENTS

该研究构建了一家虚拟多智能体翻译出版公司 TRANSAGENTS，拥有多元化的员工，包括首席执行官、高级编辑、初级编辑、译员、本地化专家和校对员。当人类客户分配书籍翻译任务时，由 TRANSAGENTS 选定的智能体团队将协作翻译书籍。这模拟了整个图书翻译过程，其中不同角色的智能体协同工作，以确保翻译始终保持高质量和一致性。

为了增强翻译过程中模拟的真实性和有效性，该研究利用 GPT-4-turbo 为每个不同的角色生成一组多样化的虚拟智能体配置文件（30 个）。如下图所示，这些配置文件经过全面设计，包含远远超出语言技能范围的广泛属性。

该研究使用两种智能体协作策略，包括加减协作（Algorithm 1）和三方协作（Algorithm 2）。

加减协作策略仅涉及两个智能体。一个充当加法智能体，负责提取尽可能多的相关信息；另一个充当减法智能体，负责检查提取的信息，消除冗余细节，并向加法智能体提供反馈。

三方协作将协作分为三个分支：

行动（Action）：遵循指令并实施所需行动；
批评：审查生成的响应并给行动分支提供建设性反馈；
判断：对响应是否满意做出最终决定，并决定是否需要进一步修改。

每个分支分配一个智能体。

评估实验

该研究在 WMT2023 DLLT 测试集上进行了自动评估，结果如下表所示：

虽然 TRANSAGENTS 在 d-BLEU 指标上表现不佳，但 d-BLEU 有局限性，可能不会充分捕捉生成文本的质量和连贯性。

与 Reference 1、GPT-4（GPT-4-1106-PREVIEW）相比，TRANSAGENTS 生成的翻译受到人类评估者偏好（MHP）情况如下图所示。

该研究还使用双语 LLM 偏好（BLP）评估了 TRANSAGENTS，结果如下图所示：

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-20

我对扣子空间与Manus的产品的思考

2025-04-20

MCP很好，但安全问题不容忽视，智能体安全框架可以解决

2025-04-20

赛博中医大师已经开始为你把脉了

2025-04-20

OpenAI 官方定义：到底什么是 AI Agent？

2025-04-20

AIGC应用必坑指南与落地实战方法论

2025-04-20

「合成用户」进化：基于访谈生成的 1000 个虚拟用户，能产出洞察吗

2025-04-20

扣子空间火了，是国产通用 agent 一个好的开始，比 manus 还差不少

2025-04-20

微软偷偷上线一款MCP神器，可让Office文件秒变Markdown！

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

本地部署大模型？看这篇就够了，Ollama 部署和实战

2024-08-13

16个具有“联网搜索”功能的AI：总有一个适合你！

2024-06-13

Cursor 一个真正让程序员产生危机感的 AI 编程工具

2024-08-21

OpenAI o1与GPT4o的对比分析

2024-09-23

大模型｜“上下文长度”和“上下文窗口”不再傻傻分不清楚！

2024-07-31

一文带你了解大模型——智能体（Agent）

2024-05-28

50+个AI大模型在不同领域的应用案例

2024-08-04

全面对比dify、coze、streamlit、chainlit

2024-04-26

【深度】AI搜索产品深度分析-搜索原理和商业模式分析

2024-07-09

一文读懂OpenAI新发布o1系列大模型

2024-09-17

大家都在问

OpenAI 官方定义：到底什么是 AI Agent？

2025-04-20

大概念模型（Large Concept Models）会取代提示工程吗？

2025-04-18

LLM中的Token和Embedding到底是啥？

2025-04-16

探秘 LLM Agents：ReAct 框架藏着哪些惊喜？

2025-04-13

MCP、Function Calling 有什么区别？与 AI Agent 有什么关系？

2025-04-13

有了MCP，还需要深入研究Agent吗？

2025-04-13

大模型备案详解：哪些企业需要备案？如何高效准备？

2025-04-12

一夜之间，所有AI都会“说普通话”！谷歌A2A协议到底有多猛？

2025-04-12

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部