微信扫码
添加专属顾问
我要投稿
“ 大模型与具体应用场景的结合,才是当前需要解决的问题”
在之前的文章中就不止一次的说过,技术的价值在于应用;而技术的本质只是一个工具,我们需要的学会使用工具,而不是制造工具。
人工智能也是工具,只不过这个工具制造起来比较复杂而已。
现在还是有很多人在纠结大模型,去研究怎么搞出一个更牛逼的大模型,或者是研究出一个能解决某个行业问题的大模型。
但不得不说,不要在研究怎么搞出一个大模型了,应该研究大模型的应用问题。
至于原因有以下几点:
学习大模型门槛很低,但搞出一个能用并且好用的大模型门槛却很高。
首先,训练一个能够解决某个行业问题的大模型,需要大量的行业数据,就这一步就已经把大部分个人或企业给排除在外了。
如果不是在某个领域深耕多年的企业,谁能找到足够的数据去训练模型?
难道全部靠爬虫爬,用钱去买?
再者说,设计一个能够适用于某个行业的模型,也需要足够的技术积累。当然,技术不是最重要的;资金,数据,人才才是最重要的。
世界上绝大部分国家造不出来原子弹,是因为它们没有原子弹的技术吗?
原子弹的制作图纸早就公开了,是因为绝大部分国家的工业能力不行,就第一步提纯铀235,就已经把世界上百分之九十以上的国家给排除了。
再者说,即使能搞出来原子弹,怎么把原子弹丢出去又是一个问题。
同理,搞一个能够解决某个行业问题的模型也是一样,第一步数据收集就已经让很多企业望而却步。
再加上大模型多次训练和微调的硬件成本,以及电力消耗,又排除了一部分人。
因此,在当今时代,学会怎么使用大模型,学会怎么把大模型和应用场景相结合更重要。
还有就是,大模型有一个特点或者说是弱点,通用大模型一般在垂直领域表现都不怎么好,垂直领域的大模型能力圈又很有限。
基于第三方大模型开发的聊天机器人,感兴趣的可以点击查看:
而对大部分企业的业务来说,不论是通用大模型,还是垂直领域的模型;显然一个模型无法解决全部业务问题,根本不同的业务类型,可能需要多个模型组合才行。
因此,即使有能力构建大模型的企业,也只会选择构建一个解决核心业务的大模型;其它的边缘业务,最好的选择也是调用第三方大模型接口。
所以,不论怎么样,都很难完全杜绝使用第三方的大模型,因此也就没必要一直纠结要搞出来一个自己的大模型。
再者,从业务的角度来说,技术只是实现业务的一种方式;没有人会关心你具体使用的是什么技术,是否是自己的技术;重要的是解决问题。
因此,只需要把大模型当作一个底层的工具,然后在其上构建应用,原则就是谁家的好用就用谁的;在实在没办法的情况下,再去设计和训练自己的大模型。
大模型+知识库+应用 = 产品
所以,对待大模型最好的方式就是,仅仅把它当作一个工具,按照具体的需求来决定是否要制造(设计并训练大模型)这个工具。
比如数据需要保密,无法直接使用第三方大模型,又或者整个业务全部在内网使用,不能暴露在公网中。
根据自己的猜测,以后或许会诞生这样的企业,那就是专门为其它企业设计和训练模型;但只给出设计方案,不参与具体的模型训练的过程。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-04-03
最好用的OCR来了?Mistral AI OCR介绍
2025-04-03
2个百度T11推出超级智能体火爆硅谷!免费使用无需邀请码,靠AI搜索功底估值已破38亿
2025-04-02
Transformer到底解决什么问题?
2025-04-02
AI大模型的2种模型能力Function call 和ReAct
2025-04-02
Playwright + DeepSeek实战:如何让AI“看懂”网站页面内容?自动定位页面元素?
2025-04-02
AI Agents的未来是事件驱动的
2025-04-02
MCP 之后,软件行业的新蛋糕与新危机
2025-04-01
MCP模型上下文协议详解(附参考资料)
2024-08-13
2024-06-13
2024-08-21
2024-09-23
2024-07-31
2024-05-28
2024-08-04
2024-04-26
2024-07-09
2024-09-17
2025-04-02
2025-04-02
2025-04-01
2025-04-01
2025-04-01
2025-03-30
2025-03-30
2025-03-28