AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


私域大模型建设记录(五)
发布日期:2024-09-03 05:29:03 浏览次数: 1662 来源:歪思大数据


路线思考

设计院里的主业是设计,延伸出去是可服务的业主方。若将数字化助力范围聚焦在主业,会有哪些需求,这些需求需要什么数据,又是怎样的应用服务可以为客户带来价值?

从院里的主业上来看,大部分是内部需求,少部分外部需求。内部需求指的是院里设计人员的需求,也就是以辅助设计为主的应用布局。外部需求指的是市场、经营人员的需求,以辅助营销为主的应用布局。可服务的业主方有哪些?这个是目前不太明确的,需要进一步信息来确认,比如说体系下的其他单位,这些都需要复杂的关系去推动进一步的调研合作。

现在要做的不是单独赋能什么应用,而是要布局,自上而下推导布局整个港航(行业)大模型该怎么做。从有限的资源来看,切入点就不是数据治理为主了,而是以语料收集为主,语料就包括公开数据,私有数据,用户数据三大块。

公开数据的方向包括:专业材料、学术材料、政策规范、标讯。 私有数据是内部规范,各种标准化模板,工程案例。 用户数据是对话数据,要在院里上应用解决。可以看作是通过一个私有大模型AI平台让院里全员参与到AI的建设中来。这才是真正要上的东西。用户使用AI所产生的数据对于模型效果(微调)而言至关重要。

大模型的这些技术都不是什么问题,问题是数据,必须导向数据这边来,说白了遥遥领先也没多少港航数据,或者他们收集不到院里自有的这部分数据。数据作为核心价值,当有了足够干净可直接用于大模型训练微调的数据,再去跟有大模型能力的厂商去谈合作。做大模型那些厂商缺啥的,他们没有行业的一手数据。假设有某家公司想要做港航大模型,那不得第一时间跟我们合作?国内外都有可能,这得持续观察,毕竟整个行业注意力都在AI这块。

数据不是卖出去,而是合作成为真正意义的数商,所以就不做外部应用啊,到时候再跟合作方去谈这些安全,私有化如何保证。多方协议对比。一些很小的应用,通常是依托公开论文和数据集的AI应用可以对外,比如越浪量预测那个东西。真正的数商绝对不是卖数据,而是卖服务,saas或paas都一样,不过形式上区别,服务群体的区别。而且说白了整个设计行当的数据量太少太少,一卖完增量压根就没多少价值。

然后就还有一个是到底有什么用的问题,得去跟内外部找真实有需求的用户:各大专业设计人员,经营人员,项目管理人员,业主方的各种岗位。去梳理这些用户的工作流,才能找到应用的切入点。通过科研来做好大模型所需要的数据沉淀,内部做私有大模型只会做 开源大模型+RAG的东西,不会涉及微调和训练,尽可能压缩成本。而且要通过科研+尽可能多内部人会使用的应用来收集一波数据,到了合适的时机去做微调和训练才有价值。所以这就一上来就把成本最高的事情给撇除在外了。

核心就是,港航这行业,能有多少数据,跟互联网每天上Pb级别的数据量比,是怎样一个比例。数据量基本也决定了你所需要的基础大模型的参数量,压根就不需要像ToC那些这么大的参数量。小模型,我现在的判断标准还是有没有使用中文语料去做训练,这个看模型发布的资料就可以知道。所以优先考虑国内像智谱做的小模型。


一些内耗

搞技术与官僚机制天然冲突,快与慢的冲突。机制有明确的自上而下流程,一层传一层,一环扣一环,往往下不可违背上,后不能推翻前。

当技术强调快速变化时,行动最重要,该重构则重构,甚至越早重构越好。导致某个流程都还没走完,一开始的想法就已经不成立了。

如果这个掌握了变化的人是上层,他会让下面的人感觉痛苦:领导/老板怎么一天一个样,这让下面的人如何适应啊,到底应该做什么,怎么优先级又变了?

如果是下面的人掌握了技术,那他可能会经常内耗,明明觉得不可为却因为上面下了命令而不得不为。这已经不是选错了目标,努力只会让你错得更离谱的问题,而是明知道目标是错的,都只能够硬着头皮走下去,只是因为下不可违背上,后不能推翻前。

尝试过创业的你发现,无论身处哪个组织,都无法专一地按自己的想法行事,又或是很难。为了要做到想法内的事,需要过多耗时耗力的沟通。吊诡的是,你又看到结果是,除了内心想做的事以外,其他的是一件都干不成。只是可能那个结果当时并不能得到上层的认同罢了。

思路就是那些思路,但带动一群人坚定不移地行动,则是另外一回事。你可能遇到领导易主,分工模式变化,开始有人将不属于你的任务安排下来,进一步放大了原本通过分工规避开的不合理工作安排。简单来说就是,你失去了更多自主,也失去了更多专注。战略和路线让你容易低估组织文化与工作模式所带来的影响。大部分成长在规训时代的人,习惯了服从,又从上方指令的模糊性里延伸出来一套中庸之道。大家努力地做着面具下的那个工作。



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询