我要投稿

手把手教你在dify中如何将用户输入的长文本分割成多个内容

发布日期：2024-08-28 14:14:20 浏览次数： 4261 作者：提示日记

如果你是dify开发者，或者是工作流的狂热爱好者，你难免会遇到这么一个问题：当用户输入一个超长文本内容时，你的工作流没办法一下子处理这么长的内容，或者没办法将这么长的内容按照预期处理的非常精致。

其实这个问题之前也总是困扰我，尤其是我最近在用dify玩超长文本翻译的工作流时，受大模型的限制，没办法一下子将超长文本一次性处理到位，于是我就想到一个替代方案，就是先将长文本切割成多个短文本，然后使用迭代节点，分批次处理，最后完成结果的拼接。这样我的大模型就有较大的把握处理好这个场景问题。

其实操作起来也很简单，就是在“开始节点”后面接入一个“代码执行”节点，并且这个代码执行节点只写最基础的脚本，不需要处理复杂的逻辑。如下是Python代码参考示例：


def main(input_text: str) -> str:    token_limit = 1000    overlap = 100    chunk_size = int(token_limit * 6 * (4/3))
        # Initialize variables    chunks = []    start_index = 0    text_length = len(input_text)
    # Loop until the end of the text is reached    while start_index < text_length:        # If we are not at the beginning, adjust the start_index to ensure overlap        if start_index > 0:            start_index -= overlap
        # Calculate end index for the current chunk        end_index = start_index + chunk_size        if end_index > text_length:            end_index = text_length
        # Add the current chunk to the list        chunks.append(input_text[start_index:end_index])
        # Update the start_index for the next chunk        start_index += chunk_size
    return {        "chunks": chunks,    }

请注意chunks输出变量的类型要选array[string]。

代码节点将 input_text 分成长度为 token_limit 的块。每个块相互重叠，以确保文本的一致性。

代码节点输出一个由 input_texts 分段文本组成的数组 chunks。

当我们切分长文本之后，后面就要跟上一个迭代节点，按照你的实际需要分批次加工了。

迭代逻辑处理完成后，你最终是需要将内容拼接好，并展示出来的，所以你可能会用到“模板转换”节点。当然，你使用代码执行节点，手搓代码进行拼接也是可以的，这个随你的编程能力而定。

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业

相关资讯

2025-04-27

Docker 部署 dify 连接 ollama 模型报错？

2025-04-27

Dify 工作流→ 节点及相关功能

2025-04-26

java对接Dify的工作流API(实战篇)

2025-04-26

关于一次dify的渗透

2025-04-26

基于dify开发一个数据可视化分析小助手

2025-04-25

dify v1.3.0发布：插件自动更新、Mermaid优化，AI开发更高效！

2025-04-23

Dify “Agent节点” 让工作流学会 “自主推理”

2025-04-23

Dify 开放插件生态：赋能企业 AI 应用创新与智能化转型

了解更多

了解更多

160+中大型企业正在使用53AI

立即咨询预约演示

把握AI发展的机遇，共同探索、共同进步

2025-01-22

如何打造基于GenAI的员工服务机器人

2025-01-22

热点资讯

Coze，Dify，FastGPT，哪个更强？全方位对比分析来了！

2024-12-24

ChatGPT+工作流自动化处理复杂任务 | Dify工作流完整教学 | 比肩Coze

2024-04-25

37.4k 的 Dify，一款小白也可以轻松上手的大模型开发平台（一）：部署及基础使用

2024-07-16

Dify 教程二：使用本地大模型 Ollama

2024-07-20

最佳实践｜如何在 Dify 用 Workflow 构建一个 Blog SEO AI 应用？

2024-04-24

Dify v0.6.11：引入 Firecrawl 实现网页数据抓取，强化 Workflow 团队协作

2024-06-21

Dify Workflow 重磅上线！

2024-05-08

dify案例分享-基于jina和http实现36氪新闻热榜文章

2024-11-15

AI | 基于 Dify + 大模型（LLM）+ 智能体（Agent）手把手从0-1构建私有化智能助手

2024-05-09

Dify + FastAPI 创建自定义工具

2024-08-06

大家都在问

Docker 部署 dify 连接 ollama 模型报错？

2025-04-27

从开发角度对比 dify 和 n8n：哪个更适合你？

2025-04-15

Dify 实现DeepResearch工作流拆解并再看升级版Dify能否搭建出Manus？

2025-03-20

打开日本市场背后，Dify 是怎么做 AI 全球化的？

2024-12-19

Dify v0.8.1：如何使用 OpenAI 的 o1 系列模型构建 LLM 应用？

2024-09-13

六大智能体平台大比拼：Coze如何脱颖而出？

2024-09-13

如何增强 Dify 的知识库检索能力？

2024-08-28

最佳实践｜如何在 Dify 用 Workflow 构建一个 Blog SEO AI 应用？

2024-04-24

热门标签

内容创作大模型技术个人提效 langchain llamaindex 多模态技术 RAG技术智能客服知识图谱模型微调 RAGFlow coze Dify Fastgpt Bisheng Qanything AI+汽车 AI+金融 AI+工业 AI+培训 AI+SaaS 提示词框架提示词技巧 AI+电商 AI面试数字员工 ChatBI 知识管理开源大模型智能营销智能硬件智能化改造 AI+医疗 MaxKB

应聘简历请发送至： ceo@53ai.com

友情链接：

CopyRight © 2012-2024 深圳市博思协创网络科技有限公司版权所有

粤ICP备17114055号

广州：广州市华景路37号(华景软件园)暨南大学科技大厦6楼（整层）

深圳：深圳市福田区泰然四路29号天安创新科技广场一期A座1204

上海：上海市浦东新区金新路58号1602室

微信扫码
和创始人交个朋友

联系我们

售前咨询

预约演示

微信扫码

添加专属顾问

回到顶部