AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


Dify+Kodbox网盘+剪映数字人,一周打造出千人千面的的周报系统
发布日期:2024-10-09 12:14:57 浏览次数: 1835 来源:信息化与数字化


最近团队做了一个有趣的工具,实现了团队周报汇总并且以数字人的形式输出,替代了之前的PPT周报开会模式。从提出概念到初步落地,大概用了一周的时间,整个方案使用了Dify+Kodbox网盘+剪映软件的数字人功能。

相信大多数员工和管理者都经历过周报系统,尤其在层级较多的大型企业中。从周五到周一,各部门都在召开每周例会,各种信息在公司内部不断汇总和调整,最终形成可供讨论的材料,在会议中达成决策和行动。

一些协同软件,例如飞书、钉钉和企业微信,将文档与即时通讯和会议系统完美整合,使得总结、汇报和开会不再成为员工的负担。然而,对于需要私有部署的企业来说,由于信息保密需求,核心数据不愿意放在云上,因此无法使用这些SaaS版的协同软件。企业也希望能够灵活使用自己的数据,因此诞生了定制周报系统的需求。

许多大型企业都有过自建周报系统的经历但这种定制化项目往往“吃力不讨好”。每个企业都有独特的管理风格,各部门的流程和职责差异显著。一个在某公司或部门表现良好的周报系统,换到另一个环境可能就难以适应。另外,周报系统的建设和推广还有其他的难点:

  1. 周报日报系统普及难度大。有的团队能够很好把周报系统用起来,但是有的团队的风格很难适应周报这种管理方式,例如那些偏向创造性思维、发散性思维的团队很难保证在固定时间内的工作输出。

  2. 团队管理风格差异大。有些管理者喜欢以日历形式总结每天工作任务,而另一些则偏好根据重点项目的进度和里程碑进行总结,系统的建设需要去定制化的适应每个团队不同的风格。

  3. 组织架构变动频繁。当一个部门来了新的领导,可能会完全改变之前的工作汇报和开会的方式,这也使得周报系统的变动极其频繁,不同历史版本的数据也很难统一和兼容。

  4. 时间维度,与工作的维度不一致。工作可以按照多种维度展开,比如人员、组织、任务类型、时间以及空间等。而“一周”其实只是时间维度中的一个简单单位,未必能够全面反映工作的实际情况和进度。自然界或法律规定的日、周、月、年等时间周期,也未必能够精确匹配实际的工作节奏。有些任务可能在半小时内即可完成,无需额外时间进行总结。而较为复杂的任务可能在一周内没有显著进展,大家为了填满周报,可能会将零碎的工作拼凑进去,这样可能会缺乏战略任务的连续性和深入分解。

  5. 很多周报只有“上传”的功能,缺乏“下达”的功能。信息在汇总过程中白压缩后有信息损失,往往在传递1-2级后就消失了,例如某项工作是谁做具体的,管理层很难再基于原始信息进行准确的评价和决策。

  6. 周报系统取数据难。许多关键信息如运营数据、财务指标、项目进度等,可能需要从多个系统中提取。员工为了写几百字的周报,可能需要查询大量数据源。有些专业岗位,例如销售,其工作的内容已经在CRM系统里有了总结,但是为了写周报,还得人工的把数据和文字从一个系统搬到周报系统中,人在这里成了系统信息的搬运机器。

  7. 周报里汇报的往往是结果,缺乏过程的深度信息。结果可能只是一个简短的总结,比如“项目A完成了初步测试”,“项目B招投标输给了竞争对手”,“销售额增加了5%”。但这些数字背后隐藏的细节和深层原因,却未能得到充分展现。在企业的信息传递中,很多信息可以口头沟通,但是却不方便留痕,例如客户内部的决策过程。

  8. 数据泄露风险:周报系统收集了大量的敏感数据,如财务情况、运营数据、项目进度等,如果安全防护不够严密,存在数据泄露的风险;但是如果不做分享,又起不到信息拉通的作用。需要在数据共享和信息透明度之间找到平衡,防止敏感信息的滥用。

我们常见的数字化系统是非常擅长处理结构化数据的,例如ERP,KPI等。在这些系统里,设置好元数据、表结构、管理和业务逻辑关系等,然后就可以把一个企业经营管理的流程固化进去,提升企业的运营效率。

但是,周报系统往往依赖于非结构化数据,如文字、文档和PPT,对信息管理的难度非常大。例如,同一个项目,在一个人的周报中用的是“项目管理系统”,在另一个人的周报中可能写作“禅道”(一个开源版本的项目管理软件)这样的产品术语,无法通过简单的标签和数据标准化进行归一化。

这种多样化的问题不仅限于项目名称,还可能涉及不同的表达风格,如风险评估和进度汇报。一位员工可能用“进展顺利”来描述项目,另一位则可能写“按计划进行”,但两者含义基本相同。不同员工的风险偏好和表达风格也会有很大的差异,一位为员工描述的“项目有风险”,可能是1-10级别里的第7级风险;而另一个员工描述中的“项目有重大风险”,可能也是1-10级别里的第7级风险,管理者需要对团队每个员工的风格非常熟悉,才能识别出其中的差异。管理者在处理这些非结构化数据时,不仅耗时,而且容易遗漏关键信息,从而影响准确的决策。

那么什么样的工具适合处理这些非结构数据呢,那肯定是AI大模型了。AI大模型对文字的处理方式非常像人类的大脑,尤其是在信息的压缩上。如果人类的大脑可以很好的处理企业中的信息沟通难题,那么AI大模型大概率也可以做的还不错。

《企业管理与大模型:向上沟通是”压缩“,向下沟通是”扩散“》


Dify周报工作流

今天我们来看一看,怎样用一周的时间,在尽量不写代码的情况下搭建一套适合各个团队的周报管理系统。这样每个团队都可以更简单地自定义自己的沟通和协同方式了。

Dify是一个开放源代码的大语言模型应用开发平台,集成了知识库和多种大语言模型,旨在简化复杂任务的处理。其核心特性包括将复杂任务分解为更容易管理的小任务,从而降低使用门槛,并通过工作流设计提高任务处理的效率和稳定性。Dify使新手用户也能轻松创建功能强大的AI助手,无需深入掌握复杂的提示词编写技巧。类似平台如字节的Coze、FastGPT和Zapier也在采用这种工作流设计方法,显示了其在AI应用落地中的广泛认可和应用可行性。

利用Dify来搭建周报系统的大概流程如下:

  1. 整个交互体系做成IM或者邮件里的智能助理,智能助理来调用Dify工作流完成大部分的工作。因为IM占据了企业流量的入口,大家不需要再多点两下进入一个单独的系统。

  2. 智能助理提示员工写周报,并提供跟其岗位和工作匹配的模板,一些数据和信息也可以通过接口从其他系统自动抓取,帮助填好初始的信息。

  3. 员工填写周报,填写后AI可以根据预设的提示词来进行文字的自动优化,例如在出差路上的口语化的段落转化为较为正式的文字。

  4. AI周报系统根据每个团队的提示词,提示词中可能包含该团队的KPI、OKR,岗位职能和最近的重点等,汇总团队每个员工的周报,例如将十个团队成员每人200字的周报汇总并压缩成一份1000字的团队周报。

  5. 团队负责人对AI总结的周报进行点评,修改,并加上自己的工作总结。

  6. 更上一级的团队的周报继续根据团队的“提示词”,结合其他系统提取出来的数据,AI对这些信息进行整理和汇总。

  7. 每个团队的汇总周报通过数字人的工作流,形成短视频和直播风格的工作汇报内容。

  8. 在专项汇报方面,例如月度工作总结、季度工作总结、年度工作总结,以及针对内部团队和客户的报告,可以通过专门的工作流进行优化,以提高汇报的效率和质量。



通过这一系列流程,员工和管理者能够迅速借鉴并沉淀自身的工作风格和管理经验,将其转化为AI的“提示词”。人类在使用自己的母语输出时候最为轻松,思维也能够聚焦在真正的深度思考上;而使用其他的语言时,需要耗费大量的脑力在非母语的实时转换上,需要消费大量的脑力。通过AI大模型,员工可以用自己最熟悉和舒适的原生思维方式进行输出,而AI大模型在这里充当一个翻译器,帮助大家在企业里与不同人、不同部门进行有效的沟通。对于那些语言加工能力不是很强的理工科从业者,这样的工具应该挺好用。

GPT-4的诞生,堪比人类语言的出现时刻

下面我们简单介绍一下Dify里一些模块的流程:

例如点评周报的功能可以分为下面几个步骤:

  1. 根据用户指令获取周报日期、用户所属部门等相关信息。

  2. 从网盘中读取AI汇总的周报内容,并获取用户自定义的点评周报提示词。

  3. 如果用户未提供自定义的点评周报提示词,将自动从网盘中读取默认提示词,并将此提示词与AI汇总的周报内容一起输入到大模型中进行处理。

  4. 将大模型生成的点评周报内容存储到网盘,并生成AI汇总周报文件的分享链接,方便用户进行比对和查阅。

Kodbox网盘的结构树

Kodbox是一个开源的网盘软件,虽然在Github上的Star没有另外几个网盘产品那么多,但是由于其UI的风格很像Windows的操作系统,用户上手起来比较容易。Kodbox提供了基本的文件操作功能,如浏览、上传、下载、删除、重命名、复制、剪切和粘贴等,另外也内置了强大的文件预览和编辑功能,支持多种文件格式,如文本文件、Office 文件、图片、视频和音频等。这些功能就可以使得开发团队不用去写任何的前端界面了,通过一个网盘的界面就可以实现类似数据库和调试的功能。

https://kodcloud.com/product/kodbox/

我们自己开发了一个Dify跟网盘的API接口,这样工作流就可以无缝的跟网盘集成起来了。网盘里的内容可以自动按照公司的组织架构来展开,在每个部门每个员工的目录下,会有按照日期的目录。每个周报会对应几个版本:原始版本,AI汇总版本,和最终的修订版本。

每个员工的周报模板、周报汇总和优化提示词,也可以Markdown的格式直接存在网盘的目录中,方便Dify工作流来做查询和修改。如果希望修改某些模板和提示词,也可以直接登录网盘里“暴力修改”,不会写代码的产品经理也可以用这种方式来做产品的调试。


数字人周报:

为啥有了文字版本的周报,还得折腾数字人版本的输出呢?首先是短视频的方式能够更多的调动人大脑的各种神经单元,很容易让听众聚焦,把枯燥的工作汇报听完。另外除了文字以外,合适的语音和肢体动作也能够帮助不同的听众更好地吸收内容,数字人可以通过参数调整快速输出成不同风格的内容。例如,有的同学平时在工作汇报工作中过于严肃,笑不出来,但是数字人可以帮你转化为一个嘻哈风格的,让你很容易的放松下来,真正做到千人千面,让每个听众都看到你不同的一面

在数字人的输出过程中,需要先用AI大模型把文字版本的精炼风格的周报转化为转换为口播文案,中间加了很多口语化的词语和上下文转折。AI大模型生成的文案逻辑清晰、语言简练,完全符合口播需求,极大地节省了手动编写口播稿的时间和精力。大家可以看下两种风格的对比:

原始周报风格:

“ 一、专项进展
1. 容器平台优化:完成v1.25.2升级,支持k8s1.30,排查并解决tke集群自动更新kube-proxy问题。
2. 大数据集群迁移:HDFS存量数据同步完成,增量同步脚本开发测试完成。
3. 问答数据集生成与大模型评测:完成开源项目文件整理,umami本地部署数据收集正常。”

口播风格:

“ 容器平台优化:我们刚升级到v1.25.2,现在支持k8s1.30版本,还解决了TKE集群自动更新kube-proxy的问题。 大数据集群迁移:HDFS存量数据已经同步完毕,增量同步的脚本也开发测试完成了。 问答数据集生成与大模型评测:开源项目文件已经整理好,umami的本地部署和数据收集运行得很顺利。 ”

通过RPA的工具,将生成的口播文案自动输入剪映的数字人中。剪映的数字人功能让用户可以通过照片和视频生成虚拟形象,定制外观和动作,并实现表情捕捉和口型同步。用户还能为数字人配音,选择不同场景应用于各种视频创作,如教育、宣传和社交媒体内容操作简单且不需要专业技术背景,隐私也得到保障。通过结合AI大模型和剪映的数字人功能制作视频版周报,不仅节省大量时间和人力成本,还真正做到了“千人千面”。

更多的思考:

语言在我们社会的组织、生产和生活中发挥着至关重要的沟通作用,但是大部分基于语言的信息却无法很好被保存记录与使用目前,企业数字化的重点更多集中在业务系统上,例如ERP、CRM和电商系统等,通过这些系统记录的那些冰冷的数据,我们能够有效地监控企业的业务状况。然而,许多其他重要的信息,例如团队间的互动、个人与组织之间的沟通以及各种决策过程,都未被有效记录。这意味着一个企业的动态的发展过程,进化过程,这些关键“人性”的数据却没有被记录

我们现有的数字化程度远远不够。大模型的智能仍然有限,因为用于训练的数据量和数据深度都不足。很多人误以为互联网上的数据已经被充分利用,大模型的发展已经触及天花板。实际上,互联网上的数据只是社会数据的一部分,且多为简单信息,而富含推理和决策逻辑的“灰度数据”大量未被保存。这些数据往往来自于人的潜意识的思考,以及组织之间的沟通互动。

大模型现在还不够聪明,是因为我们目前训练它的数据还不够多,不够深度。以当前热门的股市为例,即使有充分信息披露的上市公司,这些信息可能也可能反映不了整体信息的万分之一。

大模型现在还不够聪明,是因为我们目前训练它的数据还不够多,不够深度。就拿现在火热的股市为例,即使是一个有较多信息披露的上市公司,这些信息可能也只占所有信息的万分之一都不到。

未来,随着AI Agent+API+RPA体系的成熟,人工智能能够帮助企业充分利用大量非结构化数据,越来越多的有深度有逻辑的“灰度数据”将会被重视并记录下来。当这些数据逐渐累积,大模型会变得更加聪明,精通各个垂直行业,能够深入理解企业的运作模式、组织结构的运转以及个人的具体需求。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询