我要投稿

生成式AI：时代，大模型及AI应用

发布日期：2024-05-22 13:56:27 浏览次数： 3237 作者：奇异因子 Xsignal

自2022年11月30日OpenAI发布ChatGPT以来，已过去17个月。在此期间，为人工智能（AI）提供计算能力的NVIDIA公司市值增长超过340%，全球范围内投入到AI技术领域的资金超过2000亿美元，数千个大型语言模型（LLM）和数十万个AI应用迅速问世。无论是科技界、企业界、投资界还是政府，AI已成为最热的话题和主题，Meta的全球业务负责人Nicola Mendelsohn 甚至称其为seismic moment，人类科技界的地震时刻，而在我们的工作和生活中，不经意间也已是”AI相伴“。

本文中，Xsignal以全新的视角带您去认知和理解AI的内在，发展以及未来。

AI时代来了吗？

如何来？

在历史的长河中，技术革命以其不可阻挡的力量，不断推动着人类经济的飞跃和社会的变革。自18世纪的工业革命起，每隔一个甲子，世界便迎来一次翻天覆地的变革。这不仅是时间的巧合，更是人类智慧和勇气的体现。

如今，距离20世纪70年代开始的，由信息通信技术(ICT)和数字革命引领的信息时代已经过去半个多世纪，经验告知，下一次科技革命或适时而来。但不要忘记，就在此次AI爆火之前，科技界的新宠还是元宇宙，而现在许多人们都认定AI将是人类科技巨大进步，是名符其实的技术革命。那么问题是：火热的AI是否可以被视为是全新的技术革命？

回顾历史，任何一次的技术革命都必须具备两个必要条件：快速的技术普及和大幅提升的生产力。

丨快速的技术普及

技术革命可以带来必要的社会、经济和环境进步，然后这一切的基础是：技术的普及。技术的普及意味着更多的应用场景，更多的商业价值，更多的用户，更多的社会认同和传播，以及更低的技术成本和更多投资。

其实，人工智能并非新物种，长期以来已经一直在为我们的技术提供动力，比如增强智能手机摄像头、改进搜索算法、数据处理等诸多方面。AI的科技发展史也可追溯到上世纪60年代，如由约瑟夫·魏泽鲍姆（Joseph Weizenbaum）在麻省理工学院开发的伊莉莎（ELIZA），用于模拟与人类进行有限的对话。但直到OpenAI 向全世界发布了更智能的生成式AI（Generative AI/GenAI）工具ChatGPT，才引发了AI的浪潮，深深嵌入公众视野。

ChatGPT以智能对话机器人的方式问世，凭借惊人的智能对话体验，极简的操作方式，广泛的应用场景，以及在手机和Web端可免费触达，ChatGPT快速突破1亿用户，其速度之快超越人类任何一个科技时代的任何一个产品。下图中对比了人类各科技时代中具有代表性的产品突破一亿用户所用的时间，相比之下ChatGPT几乎是光速级普及。

有专家将 ChatGPT 的出现比作“iPhone 时刻”，意指其具备智能手机一样的普及特征可以广泛地进入人们的日常工作和生活，成为人类智能进化的必要工具。这种观点整体值得赞同的，但值得指出的是GenAI在短短不到两年的时间里已经广泛地进入到人们的工作和生活，虽然应用程度尚有巨大的开发空间，但就普及速度来讲远远超过iPhone，要知道，iPhone用了5年半的时间才实现一亿用户，ChatGPT只用了2个月。

我们可以大胆预测对比人类历史上各科技时代，GenAI的普及速度将超越所有历史时代（如下图所示），而我们对这种速度最需要的理解就是：AI时代如风暴来袭，应及时扬帆，乘风破浪。

丨大幅提升的生产力

GenAI与先前技术浪潮对比，另一个巨大的不同便是其品质超强的生产力。

首先，GenAI是一个运用数据训练和学习事物的计算机科学领域，它模拟人类大脑的学习过程，但效率更高，它可以在几秒钟内掌握一个专业领域的知识，而人类可能需要在大学里花费数年时间。它不需要像人类那样去学习基础知识，也无需经历漫长的学习曲线，它可以让学习变得如同呼吸般自然和轻松，这正是GenAI所展现的奇迹，它以超越人类想象的速度学习和成长。GenAI的学习能力和效率，无疑为人类未来的学习和工作带来了无限可能。

其次，GenAI凭借其强大的内容生成、智能辅助和自动化能力可以极大地改善现有工作流程，释放人力资源，提高整体效率。与以往计算机和互联网浪潮相比，GenAI带来的生产力的提升将更全面，更快速和更颠覆。未来10年，90%工作可能要经历颠覆性的变化，从初级岗位到高管，每个人都将在十年内面临工作岗位、类型和方式的变革。

每百万营业额对应的员工人数可以作为技术驱动生产力提升的重要参考指标，从下图中可以看出，PC时代大幅降低了单位销售额的员工人数，虽在移动互联网时代，这个数字变化不大，但可以预判的是，在GenAI时代，这个数字将被大幅降低，这也意味着每个员工的单体生产力因为GenAI会被大幅提升，甚至出现超级个体，即一个员工可以多工种和多任务的高效高质量的工作，当然这也意味着超级个体公司会兴起。

海外大模型“一超多强”

国内大模型“群雄并起”

大语言模型（Large Language Model - LLM）是GenAI发展的关键驱动力，作为其核心技术，大模型的创新突破直接决定了GenAI能力的上限和应用前景。

当前，大模型技术正呈现出前所未有的发展态势。模型规模和训练数据量不断扩大，训练算法日臻成熟，计算能力持续提升。这些因素叠加让大模型的性能快速跃升。大模型的突破不仅令GenAI的应用场景日益扩大，覆盖文本创作、代码生成、分析咨询、设计绘画等多个领域，而且其性能优势也使GenAI系统在很多复杂认知任务上取得与人类水平相当的表现。

海外大语言模型的发展较为成熟，国内大语言模型也在不断发展和追赶。随着技术的不断进步，大语言模型的性能和应用场景将会不断提升和拓展。

丨海外大模型应用

海外大模型发展较早，大语言模型领域的竞争格局也逐渐形成，像 OpenAI、谷歌、Anthropic、Meta 等科技巨头以及创业公司都在相互竞争追逐，从而形成了“一超多强”这样的竞争态势，同时海外大语言模型的应用十分广泛，在聊天机器人、智能客服、内容创作等诸多领域得以运用，且在语音识别、文本生成、智能推荐系统等方面都有了显著的进步。

下图中对比了海外主要的大模型应用的月活跃用户数，可以看出ChatGPT作为"一超”具有明显领先的月活用户数量，突破2亿月活，但值得注意的是过去的6个月里这个数字并没有显著的变化.

2024年2月8日，谷歌宣布将旗下人工智能聊天机器人 Bard 正式更名为 Gemini，与其大模型的名称保持一致，同时宣布推出新的订阅计划允许用户访问其“最强大模型”Gemini Ultra 1.0，受此推动，Gemini在2月突破一亿月活，但在之后有所回落。下图的统计中包含了Bard+Gemini的共同数据。

谷歌在2月份对Gemini发布由Anthropic公司推出的Claude大模型应用以更注重AI安全以及更高的性价比而著称。在2024年3月发布Claude 3之后，月活迎来超200%的增长，达到千万量级。值得一提的是Anthropic 是一家由前 OpenAI 成员共同创立的 AI 初创公司，以关注 AI 伦理相关的安全而闻名。创始人包括姐弟Dario 和 Daniela，他们曾是 OpenAI GPT-3 项目不可或缺的一部分，后来因 AI 安全问题而分道扬镳，从而促成了 Anthropic 于 2021 年的成立。

丨中国大模型应用

中国AI大模型发展极为迅速，又被比喻为“千模大战”，指的是当前国内众多企业和机构竞相研发和推出AI大模型的现象。这种现象说明国内大模型开发的火热和活力。其原因首先是政府对 AI 发展高度重视，将其提升为国家战略并出台一系列政策措施来推动AI技术的研究与应用；其次，国内的头部大型科技公司，如字节跳动，阿里巴巴、百度等都在积极投入AI大模型的研发，并推出了一系列具有自主知识产权的AI产品和解决方案；另外，国内的资本市场也将AI作为重要的投资领域，根据 IDC 最新发布的《全球人工智能和生成式人工智能支出指南》，中国在生成式人工智能（AI）方面的投资增长正在加速，五年复合增长率达到86.2%；同时，也有新生力量拔地而起，强势入局，如Kimi。

下图为中国Top AI大模型在APP端的月活表现，可以看出整体增长明显，整体突破千万月活，而其中由字节跳动发布的豆包发展迅速拔得头筹，而新生力量Kimi新发即强势，快速突破千万月活。大模型应用在APP端的火热说明GenAI在中国具有to C市场相当大的发展空间和潜力。

大模型应用的两个主要产品形态为APP和Web，下图呈现了在两种产品形态国内Top大模型应用的表现。可以注意到，受新年和春节的“假期效应”影响，在此期间，整体月活有所下降，但假期之后，整体实现了快速增长，豆包、Kimi和天工在春节后都呈现爆发式增长。

聚焦到2024年4月，文心一言超5000万月活占据榜首，豆包和Kimi发展强势双双接近4000万月活量级，天工凭借在2024年的快速增长，已几乎达到3000万量级。智谱清言，讯飞星火和通义组成“千万量级”第二势力。紫东太初大模型月活在还在百万量级，担其在医疗，法律，交通和内容审核等垂直专业领域展现了潜力和价值。

豆包 vs.Kimi

过去的6个月里，豆包和Kimi是无疑是大模型应用中的两个明星，两者都从不到千万月活，爆发式增长，现已接近4000万用户量级。

字节跳动作为“应用工厂”，在互联网时代已经积累了丰富的市场运作经验，豆包的推出延续了字节跳动打造高质量用户体验的产品的经验优势，同时，字节跳动利用了其强大的营销能力，对豆包进行了有效的推广。豆包在抖音、今日头条等字节跳动旗下平台上获得了大量曝光，并通过各种线上线下活动快速吸引用户。

Kimi通过精准的市场定位和功能提供，以及非常有效的多种渠道营销及社区运营，快速吸引大量用户。2023年10月首发，4个月内突破千万月活，5个月突破3000万月活，Kimi的迅速爆发在国内市场是现象级的。

对比豆包和Kimi的月活用户组成可以发现，豆包在APP端优势明显，豆包APP作为移动应用推出较早，应用场景灵活，功能多元化，涵盖问答、搜索、购物、订票等日常生活所需，因此触达用户更广泛。

而Kimi在Web端却有着更好的表现，强大的长文本处理能力是Kimi进入市场的核心卖点，以其长文本阅读和分析概括的能力，以及联网搜索和自动生成功能，吸引了广泛的用户群体。Kimi的使用者主要包括学术科研人员、互联网从业者、程序员、自媒体与内容创作者、金融和咨询分析师、法律从业人员等，这些用户群体的共性是需要处理大量文档信息，而对于长文本应用，Web端的用户体验显然更好。

AI应用借势来袭

多场景百花绽放

如上图所示，我们可以把AI应用的发展在一个平面坐标系中呈现，一个维度呈现AI应用中人和AI的角色演化，一个维度呈现AI应用类别的宏观划分。

丨AI应用的进化之路

AI应用的进化之路，经历了从人主导加上AI辅助，到AI agent主导和人辅助，再到AI自动化三个阶段。

第一阶段：人主导加上AI辅助， 在这个阶段，AI应用主要扮演辅助人类决策的角色。例如，在内容制作中，人需要清楚地描述需求，并给予对应的清晰指令和内容输入，而AI的角色是基于人的输入来完成撰写，改写或优化。再例如，在医疗诊断中，AI可以帮助医生分析医学影像数据，提高诊断的准确性。在这个阶段，人类仍然是决策的主导者，AI为其提供智能型的辅助。

第二阶段：AI agent主导和人辅助，在这个阶段，AI agent开始能够自主做出决策，但仍然需要人类的监督和辅助。例如，在自动驾驶汽车中，AI agent可以控制车辆的运动，但人类驾驶员仍然需要随时准备接管车辆。在这个阶段，AI agent的自主性有所提高，但人类仍然是决策过程中的重要参与者。

第三阶段：AI自动化，在这个阶段，AI agent能够完全自主地做出决策和执行任务，而无需人类的干预。例如，在一些工厂中，AI机器人可以完成所有的生产任务，而无需人类工人的操作。在这个阶段，AI agent已经完全实现了自动化，人类的角色被降到了最低限度。

AI应用进化之路的意义在于反映了AI技术不断发展的趋势。随着AI技术的不断进步，AI agent的自主性和决策能力将不断提高，最终将能够实现完全的自动化。这将对人类社会产生深远的影响，并带来许多新的机遇和挑战。

丨精准度和创造性

在 AI 应用中，分类可依据两个重要维度：精准度与创造性。精准度指的是 AI 应用精确完成任务的能力，像在编程，教育，医疗、金融这类需高度可靠的场景中，高精准度的AI 应用便大显身手。

创造性则代表着 AI 应用产生新颖、原创内容的能力，于艺术创作、科学研究等需要创新与想象力的场景中，高创造性的 AI 应用作用显著。例如艺术创作中，AI 能够创作音乐、绘画、诗歌等艺术作品，创作出具有独特风格的音乐或有艺术价值的绘画；在文案创作方面，它可以生成广告文案、营销文案等来提升文案的创意与吸引力，例如根据目标受众特点生成个性化广告文案。

随着AI技术的不断发展，精准型AI应用和创造型AI应用都将取得更大的进步。在未来，AI应用将突破单一维度的限制，实现精准与创造的深度融合，在各个领域发挥更大的效能。

丨现象级AI应用：Remini

在众多的AI应用，Remini最近的爆火使其成为星中之星，非常值得关注。Remini是一款由大觥科技（一家中国公司）最初开发，后来被意大利公司Bending Spoons收购的AI图像编辑软件。

它以AI技术为核心，提供多种创新的图像处理功能，包括老照片修复、画质增强、AI风格化以及黏土滤镜等。Remini因其独特的AI滤镜效果，尤其是在社交媒体上流行的黏土滤镜风格，迅速走红并吸引了大量用户。

Remini 生成的图片，并不是在原图加一层滤镜这么简单，其会对照片里的人物的表情，背景，衣着给予创作，同时每次生成的效果都有不同，增加的盲盒效应让用户对其的使用欲罢不能。

Remini 2019年便进入海外市场，并表现出色，年收益达上亿美金，而在中国市场一直没有过多的推广，直到今年的五一假期期间，Remini 的特效图从五一前就开始在抖音和小红书上，被用户自发传播，迅速火遍全网，同时登上苹果中国区 Appstore 免费榜的榜首。通过上图我们可以看到，4月29日开始，Remini在抖音的声量和互动量飙升，并在整个五一假期期间持续，同时，其日活跃用户规模对应快速增长，突破千万日活。

丨AI教育应用的出海双骄

中国AI应用走出国门已经是潮流般的趋势，在AI教育应用领域，字节跳动和作业帮都在推出了各自的产品：Gauth 和 Question AI，并在海外取得了巨大的成功。2024年4月，Gauth 和 Question AI 占据了美国 iOS 教育类下载榜单的第二和第三位，排名仅次于多邻国。两款应用均利用AI技术为数学、化学、生物、物理等多学科问题提供分步解题方法，支持多种解题方法，学生可以根据自己的理解选择最适合的解法，同时并拥有庞大的试题库。

在APP端，两个AI应用进入2024之后月活规模都实现了爆发式增涨（见下图），Gauth在一月还不足百万月活，而到三月已经突破400万月活。Question AI在4月已经接近500万月活。

通过下图的数据可以注意到，Gauth在Web端的应用更广泛，而Question AI在APP端更强势。这个差别来自于两个产品的定位差异。Gauth以网站应用为主，这更符合传统的学习场景，通常是在电脑前进行，因此Web端应用能够更好地符合用户的使用习惯。而Question AI更注重APP端的应用，目的为提供更加便捷和即时的学习体验，学生可以随时随地使用手机或平板电脑进行学习和解题，并通过手机实现拍照搜题和语音问答等功能，同时Question AI采用AI Chatbot对话问答的交互模式，因此在手机端的应用体验也更好。Gauth月活已经突破900万量级，实现千万量级月活指日可待。

丨AI应用的趋势研究

AI应用已经呈现出蓬勃发展的态势，各类AI应用层出不穷，然而，不同类型的AI应用在市场上的被需求程度的趋势却各有不同，通过AI应用相关的热词在社媒的声量表现（如上图所示），我们可以注意到：

AI文本编辑类应用火热异常，其利用GenAI技术，可以自动生成文本、翻译语言、校对语法、优化文风等，帮助用户提高写作效率和质量，而在工作中写作场景比较高频，且对于许多缺乏写作技巧或时间精力有限人，AI辅助写作可以大幅提升效率和质量，因此人们对文本编辑类AI应用的需求越来越大，依赖越来越强。

AI视频剪辑类应用逐渐降温，与AI文本编辑类应用相比，AI视频剪辑类应用的技术成熟度相对较低。在一些功能方面，例如视频识别、剪辑和特效添加等，AI视频剪辑类应用的准确性和效率还有待提高。这导致部分用户在使用AI视频剪辑类应用时，无法获得理想的效果，从而降低了用户的满意度和使用率。但随着AI技术和能力的持续发展，AI视频编辑依然会是非常重要的AI应用场景。

网站分析类AI应用需求持续增长，网站分析类AI应用可以应用于各种类型的网站，为网站运营者提供全面的网站分析数据和洞察，包括帮助企业深入理解用户行为，优化网站设计，提升用户体验，从而促进业务增长，以及分析用户偏好和行为模式，为用户定制个性化内容和服务，增强用户粘性，帮助提高网站流量、转化率和用户留存率。其应用对象包括了电商类的品牌独立站，内容型网站，新闻网站，社媒网站和教育类网站等。

结语：AI时代，欢迎你的到来

我们正在进入一个全新的技术革命时代：AI时代。它以不曾有过的普及速度和超强生产力的创造能力驰掣而来，而点燃这一切的便是GenAI的问世。大模型技术正日新月异的变化，同时，海外和国内的大模型格局正逐渐形成。AI应用如在大模型中开出的朵朵鲜花，将人类逐渐推向智能时代，并创造了巨大的商业机会和空间。在AI应用领域，中国企业启动迅敏，发展疾驰，在中国和海外市场皆盛开花朵。AI应用的发展趋势更指向AI技术相对成熟，应用场景高频，需求满足度较高，且能带来直接价值的领域。

或许我们很幸运，与AI时代不期而遇，那样的迅速，那样的震撼，那样的望无止境... ...

- The end

53AI，企业落地大模型首选服务商

产品：场景落地咨询+大模型应用平台+行业解决方案

承诺：免费场景POC验证，效果验证后签署服务协议。零风险落地应用大模型，已交付160+中大型企业