微信扫码
与创始人交个朋友
我要投稿
在过去的一年里,不论是身边人的闲聊,还是技术论坛上的深入讨论,生成式人工智能技术的话题无处不在。生成式人工智能技术,正在改变企业思考产品的方式、开发软件的方式以及利用技术提高生产力的方式。
2023 年,全球各地的公司都在这项技术上投入资源,以充分了解其能力和适用性。然而,随着深入了解,大家意识到一个新问题:如果生成式人工智能技术不受约束,它极有可能会犯错。它可能会生成不存在的 URL、编造数据、发布不必要的道歉,甚至修改某些重要比赛的结果。
因此,企业开始追求质量提升。他们采用了新的持续集成/持续交付(CI/CD)和回归测试方法,减少了不适当智能响应的难题。他们还在生产环境中加强了对人工智能解决方案的监控 —— 这是一个类似于传统软件开发的复杂过程,但由于生成式人工智能技术的不可预测性,使得这个过程变得更加复杂。
在 2024 年,已知的错误类型包括基础性、流畅性、输出长度和不可预测延迟等,所有这些都需要在合并到主分支之前进行回归测试。此外,确保生成的文本和数字媒体内容合规也至关重要,它需要通过严格的测试以防止生成仇恨言论、不恰当的或与事实不符的内容。此外,还需要采取其他措施,防止有人试图操纵或 "越狱 "系统。测试和监控是需要持续进行的,对单个请求和整体系统都需要,以防止随着时间的推移出现任何偏差。
要创建支持高级用例的负责任的、真正具有变革性的、定制的、可用于生产的 Copilot 智能副驾驶®,需要将多个互操作 API 与模型、提示和基础数据相结合,并进行微调、测试和大规模部署。为此,开发者需要合适的工具。
01
我们非常高兴地宣布 Azure AI Studio (国际版)现已全面上市,作为您开发和部署生成式智能应用的首选平台,无论您的生成式智能用例是什么,Azure AI Studio(国际版) 都能加速整个生成式智能开发生命周期,使开发者能够利用人工智能构建和塑造未来。
Azure AI Studio (国际版)是微软 Copilot 智能副驾驶®平台的重要组成部分。它是一个专业代码平台,提供完全自定义和具有配置生成式智能应用的能力,此外它还具有 Azure 级的安全性、隐私性和合规性。灵活且集成的可视化和代码优先工具,以及预构建的快速入门模板,可简化和加速使用 Azure AI(国际版)服务和工具实现创建 Copilot 智能副驾驶®的过程,它还对基础设施有完全的控制权。
它通过简单的设置、管理和 API 支持,简化了从概念到生产的转化过程,同时还帮助开发者解决安全和质量问题。该平台包括 Azure AI(国际版)服务,如 Azure OpenAI(国际版)服务和 Azure AI(国际版)搜索,以及来自 Azure 机器学习的开发者熟知的工具,如用于快速原型设计的提示流。它支持代码优先的 SDK 和 CLI,并与 Azure 开发者(AZD)CLI 和 Visual Studio Code 的智能工具包集成,以在需求增长时提供所需的可扩展性。
02
探索适合您用例的最佳人工智能服务和模型
无论何种用例,开发者都可以利用开箱即用的可定制模型和 API(如语言、语音、内容安全等)构建智能的多模态、多语言智能副驾。
通过模型目录,您可以找到来自微软和其他提供商的600多个模型,包括 GPT 4 Turbo with Vision 和微软的小语言模型(SLM)Phi3,以及来自 Core42 和 Nixtla 的新模型。Bria AI、Gretel、NTT DATA、Stability AI、AI21和Cohere Rerank 的模型将在不久之后推出。Azure AI (国际版)提供最广泛的部署模型,经过打包和优化,可在 Azure AI 平台上运行。同时,Hugging Face 系列提供了数百个模型,使用户能够根据需要选择最适合的模型。
Azure AI Studio (国际版)的模型基准仪表板,允许开发者对各种行业标准数据集的模型性能进行比较,以了解特定模型的最佳性能。基准测试使用准确性、一致性、流畅性和 GPT 相似性等指标对模型进行评估。用户可以通过仪表板图形和列表格式查看基准结果,从而对模型进行并排比较。
模型目录提供两种部署模型的方法: 模型即服务(MaaS)和模型即平台(MaaP)。模型即服务提供按令牌付费的定价方式;模型即平台则提供部署在专用虚拟机(VM)上的模型,它按每小时 VM 计费。
Azure AI Studio (国际版)还会在模型加入 Azure AI (国际版)集合之前扫描开源模型,检测它们是否存在安全威胁和漏洞,并在模型卡中提供验证信息,以便开发者可以放心的部署模型。
03
Azure AI Studio (国际版)提供协作和全面的工具,以支持开发生命周期,可使您的应用与众不同。
设置您的 Hub 和项目
Azure AI Studio (国际版)可加速基于团队的人工智能开发,其中央 hub 可跨项目共享资源,帮助消除 IT 瓶颈。开发者还可以通过启动脚本或使用 studio UI 启动项目。脚本一旦执行,就会生成一个 .env 文件,其中包括对连接资源的引用以及所需的访问密钥。
每个 hub 可连接任意数量的项目,这些项目可继承 hub 的安全配置。Hub 和项目都是具有安全意识的实体。在 Hub 内可以指定管理员,以管理人工智能资源并控制项目成员的访问权限。Azure AI Studio (国际版)的连接框架旨在验证和集成来自微软生态系统和外部提供商的各种资源。
在 playground 中试验 prompts
在 AI Studio (国际版)中,为开发者配备了一套友好的 Playground,包括聊天机器人、助手、图像生成和文本补全等。这种灵活的沙盒环境允许开发者使用各种模型进行实验,通过迭代测试优化系统提示,使用自己的数据集进行模型定制,以获得满足特定需求的结果。此外,开发者还可以试验安全系统消息。
使用 Azure AI (国际版)搜索进行数据检索
Azure AI Studio (国际版)原生支持 Azure AI 搜索,用于检索增强生成(RAG)场景,使开发者能够利用数据检索方法,基于安全的客户特定数据作出响应。该平台可与众多数据源轻松集成,包括 Microsoft Fabric 中的 OneLake、Azure Blob Storage 和 Azure Files。由于数据资产可以集成到模型工作流中,因此这种连接集成使用户能够开发出更智能、更具感知上下文的 Copilot 智能副驾驶®。
微调
在开发生成式人工智能应用时,RAG(检索增强生成)应用于需要外部知识的任务,而微调则适用于将预先训练好的模型调整为具有特定标记数据的任务。监督微调对于定制模型至关重要,因为专业任务通常需要大模型的推理能力,但其特定任务的范围相对较窄。在 Azure AI Studio (国际版)中,用户可以对 Babbage、Davinci、GPT-35-Turbo、GPT-4 以及 Llama 3 和 Phi-3 系列等模型进行微调。
基于代理的编排
随着开发者逐渐认识到 LLM 和 SLM 的潜力,他们正在推动复杂的实际应用开发。他们利用代理系统,如 Azure OpenAI(国际版)服务助手 API、基于功能的应用和 AutoGen 框架,来解决更复杂、更具开放的问题。正如预期的那样,这一转变带来了新的挑战,尤其是由于所应用编排的开放性。
追踪和调试
追踪对于了解 Copilot 智能副驾驶®的工作方式至关重要,尤其是在复杂的工作流中,传统的 IDE(集成开发环境)断点可能无法有效发挥作用。许多操作都是异步进行的,或者涉及流式数据,导致同一行代码对单个用户查询执行多次。Azure AI Studio(国际版)的追踪功能可帮助开发者使用简单的代码工具,通过提示流 SDK 调试这些场景。追踪功能有助于追踪延迟问题、LLM 错误、令牌使用、函数调用和依赖关系不匹配等问题。
对于注重代码体验的用户,可以使用提示流 SDK 启动本地 Playground。这样就可以进行全面的单元测试,同时将追踪日志无缝地记录到云端的 Azure AI Studio(国际版)或本地存储库中。该服务可以通过命令行启动,也可以在追踪开始时自动启动。
追踪可以通过简单的装饰器来完成。模型调用会自动被捕获。
用户可以通过集成开发环境执行 "pf flow test--flow "命令,启动本地测试环境。该命令利用提示流 SDK 创建一个交互式的 Playground,并为每次交互启用追踪功能,从而方便用户对其应用进行交互式测试。
追踪功能可捕获并详细记录 Copilot 智能副驾驶®请求过程的每一步,从而提高系统健康状况的可见性,并简化了复杂或非确定性问题的调试过程。利用 OpenTelemetry,提示流追踪与 Azure Monitor 集成,可使用连接字符串简化监控设置,实现无缝配置。
评估
除了开发和生产过程中的可观察性工具外,Azure AI Studio (国际版)还提供了系统评估生成输出的准确性、质量和安全性的工具。手动评估,即手动审查和对应用生成的输出进行评分,这对于追踪一组目标优先事项的进展特别有用。例如,开发者或领域专家可能会查看不同应用变体的基础响应情况,并将结果进行比较,为下一次迭代提供参考。
自动评估有助于大规模衡量应用的质量和安全性,从而提供更全面的评估结果。开发者可以使用预先构建的指标进行自动评估,也可以使用 studio UI 或提示流 SDK 针对特定的关注点,定制和构建自己的指标。
虽然客户可以自带测试数据集,但是 AI Studio(国际版)解决了多数客户的一个主要困扰,即缺乏高质量的对抗测试数据,以评估应用的输出内容风险或易受攻击的可能性。为了大规模测试应用的安全性,Azure AI Studio (国际版)将自动生成对抗性输入,并对应用进行角色扮演攻击,以生成提示和响应的测试数据集,供评估使用。开发者可以使用最终分数和测试结果,来了解他们的应用是否可以发布,或者仍需要做更多工作,以降低风险。
评估器可帮助开发者进一步实现自定义和扩展。用户可以定义一个评估器来评估自己定义的属性。例如,如果零售商希望客服机器人体现其品牌属性,可以设计一个评估器来评估输出的基础性(预置指标)和礼貌度(自定义指标)。评估器可以进行版本控制并在组织内共享,因此零售商可以选择在每次自动评估时运行自定义评估器,以提高项目间的一致性。开发者可以使用提示流 SDK 在本地运行评估器并将结果记录在云中,也可以在 Azure AI Studio (国际版)UI 中作为自动评估的一部分运行评估器。
04
使用可配置的过滤器和控件,保护人工智能应用
一旦客户部署他们的解决方案,Azure AI 内容安全(Azure AI Content Safety)会通过各种分类模型运行输入提示和输出完成,从而保护应用端点。内置安全度量指标旨在帮助识别和防御有害、有偏见、无根据和不适当的内容,以及对维护对用户信任所需的关键提示进行的攻击。在Build大会上,我们发布了自定义类别,这样用户就可以在所提供的默认过滤器之外,创建和使用自定义内容过滤器。
05
开发者可以将他们的智能创新,部署和扩展到 Azure Web 应用程序,以便在网站和应用中使用,或作为容器化模型进行本地部署。他们还可以自动执行工作流和警报,以便及时解决问题。
开发者通过跨组织资源管理保持敏捷性。他们可以使用 Microsoft Entra ID 安全管理在线终端,同时 Azure 提供了企业级的安全性、隐私性和合规性,适用于规模化的治理。
06
迄今为止,Azure AI 为超过 53,000 家客户推动创新,而且这一数字还在不断增长。客户通过企业聊天提供多模式知识挖掘,并通过先进的数据和语音分析改善客户互动和服务。他们还能更高效地生成内容,同时通过个性化服务,为销售和营销战略赋能。
Sweco 公司使用 GPT
Sweco 是欧洲一家建筑和工程公司,该公司开发了 SwecoGPT,以帮助其顾问查找关键项目信息、创建和分析文档,并利用节省下来的时间为客户提供更加个性化的服务。通过 Azure AI Studio(国际版),他们能够快速部署,突显了 Azure AI 的弹性和强大性。
借助 Azure AI Studio(国际版),我们能够快速开发 POC,以了解 SwecoGPT 的操作界面以及如何使我们的顾问和我们的业务整体受益。这充分展示了 Azure AI 的强大功能和可扩展性。
—— David Hunter
Sweco 人工智能与自动化主管
对于我们来说,Azure AI Studio(国际版)的潜力,以及我们可以为客户做的,都是无限的。
—— Shah Muhammad
Sweco AB 人工智能创新负责人
Parloa 的人工智能对话平台
Parloa 使用 Azure AI Studio (国际版)创建了多语言 AI Copilot 智能副驾驶®,可简化跨通信渠道的客户服务。
我们认为 Azure AI Studio (国际版)是一个强大的、全新的开发者平台,可以帮助我们为未来的智能联络中心平台,开发 AI 代理。
—— Ciaran O'Reilly
Parloa 对话式人工智能工程负责人
H&R Block 的人工智能税务助手
H&R Block 是 Azure AI 的长期客户。他们的最新创新产品 —— AI 税务助手,是一个简化报税流程的人工智能代理。
有了 Azure AI Studio(国际版),我们的开发者可以更快地编写代码,因此他们有时间进行'实验',对一些功能进行微调。比如允许个人根据需要进行对话式提问,以及能够重新访问以前的对话记录。我们将继续采用这种方法,推动创新,提供最佳体验。
—— Aditya Thadani
H&R Block 人工智能平台副总裁
Azure AI Studio(国际版)的客户创新不仅突显了该平台的强大功能,还证明了它在推动各行各业实现事半功倍方面所发挥的作用。
07
Azure AI Studio (国际版)正在重塑人工智能应用开发方式,提供了一个周到且强大的平台,将创新与责任相结合。在微软技术的支持下,开发团队拥有各种工具,可以自信地探索生成式人工智能的可能性,并部署可用于生产的 Copilot 智能副驾驶®。立即体验 Azure AI Studio (国际版)的尖端功能,自信、轻松地开始构建、测试和部署!
开始使用 Azure AI Studio (国际版)
53AI,企业落地应用大模型首选服务商
产品:大模型应用平台+智能体定制开发+落地咨询服务
承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2024-11-20
深入了解Fine-Tuning:解锁大语言模型的潜能
2024-11-19
大模型RAG神器,利用LangSmith监测、跟踪、微调LLM和RAG
2024-11-19
9.9比9.11大0.79,让大模型准确地做好数学题
2024-11-19
LLM实践系列-详聊OpenRLHF中的各种Loss
2024-11-18
LLM实践系列-聊聊大模型STF的数据清洗过程有多繁琐?
2024-11-16
深入理解预训练与微调,为什么需要预训练,什么是微调?
2024-11-16
GenAI部署:成功率与ROI为何双下滑?
2024-11-13
无需网络,轻松在手机上离线布署本地大模型
2024-07-11
2024-07-11
2024-07-09
2024-09-18
2024-06-11
2024-07-23
2024-07-20
2024-07-12
2024-07-26
2024-07-23
2024-11-18
2024-11-16
2024-11-16
2024-10-31
2024-10-31
2024-10-27
2024-10-26
2024-10-25