我要投稿

企业生成式AI：2024 年企业的 10 多个用例和最佳实践

发布日期：2024-06-02 05:18:35 浏览次数： 3813

作者：大数据杂货铺

微信搜一搜，关注“大数据杂货铺”

与中型市场公司或初创公司相比，生成式人工智能（GenAI）为企业提供了新的机遇，包括：

•企业生成式人工智能用例

•有机会在不向第三方公开私人数据的情况下构建公司模型

然而，生成式人工智能是一项新技术，给企业带来了独特的挑战：

•有价值的专有数据可能会被泄露，36% 的企业表示这是不使用商业大语言模型的原因(1)

•生成式人工智能工具将创造新的服务和解决方案。技术领导者可以利用它们进入新市场，以牺牲现有企业的利益为代价获得市场份额。

•生成式人工智能模型，也称为生成模型，将带来新的自动化机会，有可能提高客户满意度或降低成本。竞争对手可以利用它们取得领先。

•由于生成模型的偏差或幻觉而导致的声誉或运营风险

高管们想知道他们的组织如何在克服这些挑战的同时获得生成式人工智能的好处。下面，我们概述一下：

•大公司的生成式人工智能用例

•利用生成式人工智能解决方案的全部潜力的指南，包括如何构建和管理公司的生成模型。

1. 企业应该如何利用生成式人工智能？

我们为企业利用生成式人工智能制定了详细的路径。

虽然大多数公司可能不需要构建模型，但大多数大型企业（即福布斯全球 2000 强）预计将在未来几年内根据其业务需求构建或优化一个或多个生成式 AI 模型。微调可以帮助企业实现以下目标：

•通过针对自己的领域详细定制模型输出来获得更高的准确性

•节省成本。经过测量，具有允许商业使用许可的可定制模型几乎与专有模型一样准确，而且成本显着降低。(2)

•减少机密数据的攻击面

像彭博社这样的公司正在通过利用内部数据构建自己的生成式人工智能工具来创造世界一流的业绩。(3)

2. 企业人工智能模型的指导方针是什么？

企业生成式人工智能模型至少应该是：

2.1 值得信赖

2.1.1 持续的

目前大多数大语言模型可以为相同的输入提供不同的输出。这限制了测试的可重复性，可能导致发布未经充分测试的模型。

2.1.2 受控

托管在企业可以精细控制模型的环境（本地或云）中。另一种方法是使用在线聊天界面或 API，例如 OpenAI 的 LLM API。

依赖 API 的缺点是用户可能需要向 API 所有者公开机密的专有数据。这增加了专有数据的攻击面。亚马逊和三星等全球领先企业在其员工使用 ChatGPT 时遭遇了内部文档和宝贵源代码的数据泄露。(4) (5)

OpenAI 后来改变了其数据保留政策并推出了企业产品。(6)然而，使用基于云的 GenAI 系统仍然存在风险。例如，API 提供商或在 API 提供商工作的不良行为者可能：

•访问企业的机密数据并用其改进自己的解决方案

•不慎泄露企业数据

2.1.3 可解释的

不幸的是，大多数生成式人工智能模型无法解释它们为何提供某些输出。这限制了它们的使用，因为希望基于人工智能助手做出重要决策的企业用户希望了解推动此类决策的数据。

2.1.4 可靠的

幻觉（即编造谎言）是大语言模型的一个特点，不太可能完全解决。企业 genAI 系统需要必要的流程和护栏，以确保有害幻觉在危害企业运营之前被最小化或被人类检测或识别。

2.1.5 安全的

企业范围的模型可能具有供外部用户使用的接口。不良行为者可以使用提示注入等技术让模型执行意外操作或共享机密数据。

2.2 道德

2.2.1 受过道德训练

应使用道德来源的数据对模型进行训练，其中知识产权 (IP) 属于企业或其供应商，并且在同意的情况下使用个人数据。

•1-生成式人工智能知识产权问题，例如训练数据中包含版权不属于模型所有者的受版权保护的内容，可能会导致模型无法使用和法律程序不可用。

•2- 在训练模型中使用个人信息可能会导致合规问题。例如，OpenAI 的 ChatGPT 在意大利数据保护局 (Garante) 的关注下需要公开其数据收集政策并允许用户删除其数据。(7)

2.2.2 公平的

训练数据的偏差会影响模型的有效性。

2.2.3 拥有许可证

企业需要拥有商业许可才能使用该模型。例如，使用像 Meta 的 LLaMa 这样的模型具有非商业许可证，阻止其在营利性企业的大多数用例中合法使用。像 Vicuna 这样建立在 LLaMa 之上的具有许可许可的模型最终也会获得非商业许可，因为它们利用了 LLaMa 模型。(8)(9)

2.2.4 可持续的

从头开始训练生成式人工智能模型成本高昂，并且消耗大量能源，从而导致碳排放。企业领导者应该意识到生成式人工智能技术的全部成本，并找到尽量减少其生态和财务成本的方法。

企业可以努力实现这些准则中的大部分，并且除了许可、道德问题和控制问题之外，它们存在于一个连续体中。

•如何获得正确的许可并避免道德问题是显而易见的，但这些目标很难实现

•实现控制需要企业建立自己的基础模型，但大多数企业并不清楚如何实现这一目标

3. 企业如何打造基础模型？

有两种方法可以在受控环境上构建公司的大语言模型基础设施。

3.1 构建您自己的模型 (BYOM)

实现世界一流的性能需要花费数百万美元，包括计算成本（在 BloombergGPT 的情况下，40GB A100 GPU 上的 130 万 GPU 小时）和数据科学团队成本。(10)

3.2 改进现有模型

2.1- 微调：是一种更便宜的机器学习技术，用于使用选定的数据集提高预训练大型语言模型 (LLM) 的性能。

指令微调以前是使用大型数据集完成的，但现在可以使用小型数据集（例如 LIMA 中的 1,000 个精选提示和响应）来实现。(11)早期商业大语言模型微调实验强调了优化数据质量和数量的稳健数据收集方法的重要性。(12)

研究论文中的计算成本低至 100 美元，同时实现了接近世界一流的性能。(13)

模型微调是一个新兴领域，每周都会发布推理时间干预（ITI）等新方法，这是一种减少模型幻觉的方法。(14)

2.2-来自人类反馈的强化学习（RLHF）：微调模型可以通过人类在环评估来进一步改进。(15) (16) (17 号)

2.3- 检索增强生成（RAG）允许企业在生成期间将关键信息传递给模型。模型可以使用此信息来产生更准确的响应。

鉴于 BYOM 涉及的高成本，我们建议企业首先使用现有模型的优化版本。语言模型优化是一个新兴领域，每周都会开发新方法。因此，企业应该对实验持开放态度，并准备好改变他们的方法。

4. 企业应该使用哪些模型来训练具有成本效益的基础模型？

机器学习平台发布了具有商业许可的基础模型，主要依赖互联网上的文本作为主要数据源。这些模型可以用作构建企业大语言模型的基础模型：

•Meta 的 Llama 2 附带商业使用许可证，但有一些限制。(18)

•Falcon LLM 由阿布扎比技术创新研究所 (TII) 开发，拥有商业许可证，截至 2023 年 9 月，用于在预训练模型中引领 Hugging Face 的 LLM 基准。(19) (20)

•Mistral 7B 是欧洲生成人工智能初创公司 Mistral 开发的第一个模型。凭借其允许商业使用的宽松许可证（即 Apache 2.0），它对于寻求更小、更易于微调模型的企业来说很有吸引力。(21)

•Huggingface 的 BLOOM 拥有 RAIL 许可证，仅限制潜在的有害用途。(22)

•Dolly 2.0 由 Databricks 基于 EleutherAI 的 pythia 模型系列进行指令调整。(23)

•开源 RWKV-4“Raven”模型(24)

•Eleuther 人工智能模型(25)

5. 构建大型语言模型的正确技术堆栈是什么？

生成式人工智能是一种人工智能技术，大型企业在过去十年中一直在构建人工智能解决方案。经验表明，利用机器学习操作 (MLOps) 平台可显着加快模型开发工作。

除了 MLOps 平台之外，企业组织还可以依赖越来越多的大型语言模型操作 (LLMOps) 工具和框架（例如 Langchain、Semantic Kernel 或 watsonx.ai）来定制和构建其模型以及 Nemo Guardrails 等 AI 风险管理工具。

在新技术的早期，我们建议高管优先考虑开放平台，以构建面向未来的系统。在新兴技术中，供应商锁定是一个重要的风险。随着技术发生快速且巨大的变化，企业可能会陷入过时的系统之中。

最后，公司的数据基础设施是生成人工智能最重要的底层技术之一：

1.大量的内部数据需要组织、格式化。

2.数据质量和可观测性工作应确保公司能够获得高质量、独特、易于使用的数据集和清晰的元数据。

3.模型训练可能需要综合数据能力

6. 如何评价大型模型的性能？

如果不衡量有效性，生成式人工智能工作的价值就无法量化。然而，由于基准数据集问题、基准渗透到训练数据、人工评审不一致等因素，LLM评估是一个难题。(26) (27) .

我们建议采用迭代方法，随着模型越来越接近用于生产，该方法会增加评估投资：

•使用基准测试分数来准备入围名单。对于大量开源模型来说，这是公开可用的。(28) (29)

•依靠 Elo 分数，(30)用于在象棋等零和游戏中对棋手进行排名，比较要选择的模型。如果存在无法使用的更高性能模型（例如由于许可或数据安全问题），则可以使用它们来比较不同模型的响应。(31)如果没有此类模型，领域专家可以比较不同模型的准确性。

7. 控制模型的替代方案是什么？

当企业组织处于以下情况之一时，可以利用科技巨头或人工智能公司（例如 OpenAI）的预训练和微调模型：

•使用不包含敏感信息的数据进行实验来证明假设

•不关心输入数据的攻击面增加

•确信他们的输入不会被第三方拦截或存储

•确信即使他们的输入被存储，它们也会被存储有限的时间，并且在存储期间不会被泄露

在这种情况下，技术团队可以使用 API 来访问模型，每次 API 调用的成本都可以承受。他们可以使用这些方法：

•零样本学习，也称为提示工程，涉及构建提示以帮助提高 LLM 输出

•少样本学习，也称为上下文学习，涉及在提示之前添加示例以提高响应质量。(32)

来源：OpenAI

这还可以包括思维链提示。(33)

资料来源：思想链提示引发大型语言模型中的推理

如果企业对基础模型提供商的数据安全策略感到满意，则检索增强生成（RAG）也可以与商业模型一起使用。

还可以进行微调，以进一步提高通过 API 提供的商业模型的模型性能。(34)

8. 在构建基础模型之前，企业应该如何处理生成式人工智能？

构建企业模型可能需要几个月的时间，因为需要完成以下步骤。其中每个步骤都可能需要数周到数月的时间，并且它们不能完全并行：

•数据收集可能需要数周到数月的时间。人工智能数据收集服务可以帮助公司生成平衡的、高质量的指令数据集和其他用于构建或微调模型的数据，从而加速这一过程。您还可以使用数据众包平台来获取更多样化的数据集。

•聘请具有大语言模型专业知识的数据科学家或聘请顾问可能需要数周到数月的时间。

•训练和部署

•将模型集成到业务流程和系统中

因此，我们建议企业领导者鼓励尝试。GenAI 需要范式转变：我们对机器的理解需要从无意识的机器人发展到共同创造者。组织需要开始与 GenAI 合作来开始这种思维转变。他们需要教育员工了解生成式人工智能的潜力，并赋予他们改变工作方式的能力。正如顾问常说的，任何转型（包括人工智能转型）中最重要的元素是人。