AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


企业想上大模型?现阶段的挑战、场景选择和落地方法
发布日期:2024-11-27 11:27:01 浏览次数: 1525 来源:大卫数智话


临近2024年末,GPT 5迟迟未出,似乎预示着大模型 Scaling Law 遭遇了瓶颈。


但是,我们也看到,大模型在即将过去的一年仍然快速演进,展现出更加强大的文本理解及生成能力,以及复杂任务的推理能力。


最近我交流的很多企业,都在积极将人工智能的探索与应用,纳入到2025年的年度计划当中


然而,企业要么处于不知道该具体做什么和怎么做的状态,要么对部署和应用大模型存在过高的期望,忽视了其本身的局限性和实际应用中的挑战。


本文就来探讨企业在应用大模型时可能遇到的挑战,以及如何选择适合的场景采用工程化应用阶段性方法论,让企业在AI大模型的投资,产生看得见的业务价值。


 1 

大模型不能“点石成金”


很多时候,我们会被大模型表面上的“能说会道”迷惑,误以为只要在企业部署了大模型,就能在各种业务场景下发挥作用。


这里讲的大模型,指的是通用的预训练大语言模型,其使用了大量文本语料做预训练,用于文本的理解和生成。


实际上,大模型的能力虽很强,但在企业级场景,并非即插即用。


主要问题有三个。


1. 大模型不懂行业与内部话语


大模型是在特定知识和数据上做的预训练,一旦训练完成,难以动态更新知识。


同时,大模型还缺乏特定领域的知识,包括企业所在行业的专业知识,以及企业内部人才听得懂的“行话”等等。


因此,大模型不可能对一个没有正确理解的专业问题,提供精确、可靠的答案。


2. 大模型不太会逻辑推理


通用大模型大多是“文科生”。


当前,大模型厂商还在努力提升大模型的逻辑推理能力。比如, OpenAI 的 o1模型和 DeepSeek 最近上线的R1-Lite模型,都在试图解决数学、代码等复杂推理问题。


然而,企业的应用场景并非数学竞赛


大模型在数学能力上的评测高分,不一定能在企业场景中产生预期的效果。


3. 大模型回答的准确性存疑


大模型缺乏可解释性,输出不稳定,可能会出现幻觉


这在文娱创意类行业,如网络小说、创意图片等,也许问题不大,甚至是加分项。


但在企业级应用场景,比如生成专业报告、数据图表分析、给出决策意见等方面,企业很难接受包含错误信息的内容


甚至,判定大模型的输出是否正确,本身也是个问题。


目前,我们对大模型输出内容的正确性没有特别好的评测方法。在很多情况下,还是依赖于人工评估


 2 

怎么从“玩具”走出来


市场上众多的文档问答、AI搜索等应用,还停留在“玩具”的水平,只能处理简单的任务,无法应对需要深度分析的复杂问题


原因有三点。


第一,用户提出的问题往往不是简单的查询,而是需要深层次分析和推理的问题。


这些问题在现有的文档中往往没有直接的答案,需要AI通过复杂的推理过程来得出新的见解。


这意味着大模型必须具备超越表面信息,深入挖掘和理解数据的能力,以便为用户提供真正有价值的答案。


第二,分析过程的复杂性要求系统能够处理多个步骤和环节,而不是仅仅依赖一次检索和回答。


这涉及到对问题的分解、相关信息的整合、以及多维度的分析,以确保答案的全面性和准确性。


大模型需要能够理解问题背后的复杂性,调用相应的工具和智能体,并采取相应的策略来逐步解决问题。


第三,仅输出文本不能满足企业级场景需求。


在智能化时代,用户不仅需要文字答案,更期待得到包含结构化数据、图表、表格和图像的丰富内容。


这要求大模型不仅要能够生成文本,还要能够整合和展示多种类型的数据,以提供更直观、更易于理解的信息。


所以,实际情况远比想象的复杂!


我们想让大模型应用,避免成为一时新鲜的“玩具”,就必须提升系统的多链路深层次分析能力,处理复杂任务的能力,以及理解与生成多模态内容的能力


 3 

在哪些场景探索应用


选对了场景,就成功了一半。


对于绝大多数企业而言,不能也没有必要先花费重金,构筑AI算力基础设施。


我们应从一个场景切入,做到眼前一亮,激发和凝聚AI应用的共识。


企业如何选择AI应用场景呢?我们要考虑三个因素:

  • 业务相关性

  • 技术成熟度

  • 使用频次


首先,看业务相关性。


举一个例子。比如法律、医疗、科研等行业,专业性非常强。其业务特点是:

  • 大量的知识输入,如书籍、文献资料等

  • 经过律师、医生、研究院等专业人士的分析

  • 进行大量的输出,如学术成果、报告等


那么,构建一个面向专业人士的“AI助手”,结合行业领域知识库,解决其中某个特定问题,显著提升专业人士的工作效率,将是一个业务强相关的好场景。


其次,看技术成熟度。


如前文所述,当前大模型应用系统,在处理复杂任务时还力不从心。因此,我们不能一开始就选择高难度场景,而是从技术成熟度比较高的场景切入。


实际上,前文所述的“AI助手”,目前要实现端到端的能力,技术成熟度还不够高,大概率会让专业人士失望。


但是,目前知识检索的技术成熟度已经非常高,运用文档解析、全文检索、向量检索、融合、重排等技术可以很好地解决问题。


这时,我们可以先聚焦在“大量的知识输入“这个特定阶段,解决专业人士收集、整理、检索大量知识的难题,让专业人士可以集中精力在分析处理上。


第三,看使用频次。


我常说,很多数字化转型项目,最终“领导不认可、员工无感知”。使用频次会极大地影响员工感知度。


我们要尽量选择高频的使用场景,不但能产生更大的业务价值,也能提升项目的可见度和影响力。


例如,面向内外部客户的智能客服、企业制度流程智能问答等场景,技术成熟度和使用频次都比较高,是可供大多数企业选择切入的好场景。


当然,大模型应用落地场景还有很多,包括智能推荐、用户画像、业务预测、风险评估等等。


重点在于结合企业的实际情况,按照以上三个因素,仔细评估和选择。实现项目预期可管理,投资可控,产出看得见,成果令人满意。


 4 

工程化应用的关键是什么


大模型不能“点石成金”,其本身在快速发展中,各类应用的技术成熟度也不一样。


企业在选择的场景上发起的每一个项目,都不是简单的软硬件部署,而是要在工程化上做很多的工作。


关注以下三点。


第一,使用大模型API服务。


通用大模型的发展,称得上日新月异。


有些企业可能会使用专有语料,通过微调训练生成自己的模型,在特定任务上短期可媲美通用大模型。


但是,企业很难在专有模型的研发与持续迭代上,达到与大模型厂商同样的速度与水平,长期来看很难追赶通用大模型能力的提升。


因此,我建议企业尽可能采用通用大模型API + 本地知识库的方式,更好地利用通用大模型的能力,同时保障本地数据的安全。


对于一些特定任务,模型参数并不要求很高,比如60亿参数的模型就可以解决问题。企业可采购相应的算力资源,在本地进行模型的训练和推理,并为AI应用提供API服务


这种模式,适合于对数据安全有更严格的要求,或者整个系统处于内网环境的情况。


第二,融合领域知识与数据。


采用大模型检索增强生成(RAG)技术,已经成为大模型在各行各业应用的主流方式。


知识库可以使大模型更好地适应特定领域的专业知识,可以实时动态更新,是大模型的完美搭档


但是,这对知识库的构建和管理,提出了更高的要求。


我们需要对文档、网页、图片等非结构化数据,进行解析、分块等处理,并尽可能保留这些信息元素,彼此之间的结构关系、语义关系。


这就要在系统中,引入优秀的文档解析工具,各种小模型以及向量数据库图数据库等工具,并进行完美的集成。


另一方面,企业还要对现有关系型数据库中的数据,进行数据治理,提升数据质量。然后,通过NL2SQL模型数据服务API智能体工具调用等方式,集成到大模型应用系统中。


当我们构建了企业级知识库和数据仓库,特别关键的是,我们要确保整个大模型应用系统,符合数据安全、网络安全和个人隐私保护等法律法规的要求。


第三,打造非凡的用户体验。


通常,对于ToB的企业软件系统,人们主要关注功能点是否满足,根据功能需求清单进行项目验收。


然而,系统的用户体验常常被忽视。


企业的每一个应用系统,实际上都有最终用户。用户是否信任这个系统,喜欢使用这个系统,对于系统的成败至关重要。


基于大模型应用的特点,我们需要特别注意以下两点,并纳入到工程项目中。


1. 输出的可解释性


大模型是一个“黑盒”,人们目前还没有真正弄清楚,大模型何以出现“涌现”的能力。


在企业级应用中,我们应提高整个系统的可解释性,将数据来源、分析、工具调用与输出的步骤,展示给用户,以增强用户对输出结果的信任。


2. 提升用户使用体验


即使是企业级应用系统,我们也应该按照互联网产品思维,从产品原型和MVP开始,注重UI/UE,对系统的每一个细节,进行精心设计。


我们要提供有设计感和不言自明的用户操作界面以符合用户的期望和习惯,从而打造让用户喜爱的系统。


 5 

如何有效地推动AI落地


生成式人工智能,已经是定的方向!


企业不能再踌躇不前,而是应该积极投入、敢于投入


面对大模型应用的复杂性,企业需要采取一种阶段性的方法论来指导实践。


红杉中国在《2024年企业数字化年度指南》中提出,企业落地AIGC应用的“AGILE五步方法论”,可以作为我们可以参考的框架。


来源:红杉中国《2024企业数字化年度指南》


1. 认知(Awareness)


在AI技术引入的初期,要自上而下形成统一认知达成共识,尤其是企业CEO和高级管理层,需要对AI能力的边界和行业实践案例有所了解。


建议企业借外部咨询专家的协助,开展AI应用相关培训和规划设计


2. 评估(Gauge)


达成共识后,企业需要进一步评估,哪些业务场景适合应用AI技术,以及应用该技术可带来哪些价值。


企业可参考上文提到的“业务相关性、技术成熟度、使用频次”三个因素对每一个场景进行评估,并邀请行业和领域专家参与,全面评估其价值潜力和技术可行性。


3. 开动(Inception)


构想不能停留在纸面上,而是必须选择试点项目,推动落地。


试点项目应有较好的投资回报率ROI,形成示范效应,为未来持续的投入奠定基础。对于创新型项目,企业需要设定合理的目标预期,做好相应的组织配套,如组建专门的“作战小组”,负责统筹规划与执行。


4. 阶梯(Ladder)


进入实操阶段后,企业要根据业务场景特点,比对评估当下可采用的各种AI大模型应用方案,持续跟进最新技术发展,选取最优解决方案


同时,企业还要注意,在实施过程中,不能期望一蹴而就,而是要小步快跑、快速迭代


5. 扩大(Expansion)


在试点项目落地获得成功后,就要进一步“以点及面”,不断扩大AI应用的范围和深度


企业要把“Think in AI”的理念,融入到业务发展的各个环节和更多的场景中去。同时,还要保持清醒。毕竟,AI应用并非企业数字化转型的全部。


 6 

结束语


总结而言,企业数字化转型已经在向智能化转型迈进。以大模型为代表的生成式人工智能技术的应用,已经成为企业的一道“必答题”。


生成式人工智能,无疑是未来十年最有潜力的生产力工具。


企业在应用大模型时,应选择合适的场景,平衡投入与回报,并制定全面的应对策略以实现真正的价值落地。


通过工程化应用、阶段性方法论,企业可以更好地推动AI技术落地,实现业务效率的提升。




推荐阅读

大模型RAG实战

《ThinkRAG开源!笔记本电脑可运行》

《大模型RAG实战|大模型应用架构设计》

《大模型RAG实战|优化对网页信息的处理》

《大模型RAG实战|实现类ChatGPT流式输出》

《大模型RAG实战|BM25检索+向量检索》

《大模型RAG实战|文本转换高级提取管道》

《大模型RAG实战|Elasticsearch实现混合检索》

《大模型RAG实战|QAnything技术栈解析》

《大模型RAG实战|构建知识库:文档与网页》

《10行代码!实现本地大模型RAG问答(2)》

《10行代码!实现本地大模型RAG问答(1)》

《本地化实现NL2SQL对话式数据查询与分析》

《在笔记本电脑上,实现本地知识库大模型RAG》

《在笔记本电脑上,5步轻松使用Gemma》
《大模型如何把企业的数据用起来》


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询