微信扫码
添加专属顾问
我要投稿
AI技术落地的关键在于数据的获取和处理,本文深度剖析了AI作为“专家”的局限性和数据的重要性。 核心内容: 1. AI技术作为专家的局限性:缺乏实时、真实、高质量的数据输入 2. 数据获取的三种途径:免费公域数据、付费报告和业内熟人的“小道消息” 3. 数据对AI决策分析的重要性:专家思维模型与实际数据的结合
AI 技术再怎么飞速发展,也逃不脱工具类技术的宿命:落地应用时需要数据输入。
不管是人工录入、API 接口获取还是文档提取,总要有这样一步“Input”作为前提,而往往就是这一步,扼住了技术落地的喉咙。
1. 专家 = 数据 + 经验
我们常把 AI 比作专家,期望 AI 可以充当一 7×24h 不眠不休、随叫随到的专家。
我们在训练模型或创建知识库时,也是通过撰写固化的问题答案对,来模拟专家经验的,但问题在于,专家除了拥有一个思维决策模型之外,还拥有从实际情境中采集、过滤(清洗)数据的能力。
也就是说,专家之所以有效,就在于数据和思维模型的结合。
AI 技术可以萃取或模拟专家的思维决策模型,或许也可以通过预训练和RAG等技术掌握尽可能多的背景参考数据,但是在实际决策分析中,仍然离不开实时、真实、高质量的数据输入。
那么这些数据从哪里来呢?
2. 海面下的数据
貌似在互联网上有海量的数据,去爬取就完了,但事实如何呢?
举个例子,商铺经营赔钱,向商场房东提出降租,房东怎么决策?可能的决策无外乎:降、部分降、不降(换租户新招商)。
但任何一个决策,都需要基于一定的数据分析,比如商铺的销售、租金、损益、周边可比商铺租金等等。
其中单是周边商铺租金,就至少会有三个数据来源:
免费的公域数据 - 你就去用各种爬虫、AI 搜索、Kimi 之类的 App 去网上搜吧,肯定一搜一大堆,但拿到的永远是看起来 OK 实则与真实租金水平相去甚远的数据;
付费可得的报告 - 你也可以花钱问各种机构购买行业报告,这个数据相对公网上搜到的会准一些,但依然会存在颗粒度不够、时效性滞后等问题;
最后,还可以找业内熟人,去打听一下隔壁商场可比店铺的租金和各种“小道儿”消息。这也是现实世界里,从业人员最常用的手段,没有任何科技含量,但是保真,有效。
上述三种渠道获取到的租金,其价格可能相差好几倍,外行甚至都不知道还会有这么多道道儿。其它行业中,也存在类似情况,真实可靠的一手数据,往往深藏在海面之下,且存在于一个个信息孤岛之中,除了人工,基本没法靠技术手段获取,AI 在这里无用武之地,效果可能还比不过一个爱打听的大妈。
3. AI交付结果?没那么简单
AI leads a service-as-software paradigm shift
https://foundationcapital.com/ai-service-as-software/
写在最后
AI技术迭代飞速,各种自媒体都在预言应用大爆发,然而一年过去了,“大爆发” 也没有到来,其中阻力,从数据源、数据采集、数据上传的角度,能窥见一斑。
归根结底,技术再多也是一串 0,掌握了数据源,一串 0 才有了 1。
53AI,企业落地大模型首选服务商
产品:场景落地咨询+大模型应用平台+行业解决方案
承诺:免费场景POC验证,效果验证后签署服务协议。零风险落地应用大模型,已交付160+中大型企业
2025-03-11
陶哲轩使用o3 mini一手测评来了:好坏参半
2025-03-11
Anything LLM高级用法-deepseek本地调用神器
2025-03-11
Rig Agents:高阶LLM编排框架
2025-03-11
终于出手了,微信公众号原生 RAG 上线,官方 AI 知识库来了!
2025-03-10
博查正式发布语义排序模型(bocha-semantic-reranker)
2025-03-10
AI比人类更需要搜索引擎,我们专门为AI设计了一个搜索引擎
2025-03-10
超越 RAG:Memobase 为 AI 应用注入长期记忆
2025-03-10
【AI落地应用实战】RAGFlow + 知识图谱 + Deepseek 初步探索
2024-09-04
2024-10-27
2024-07-18
2024-05-05
2024-06-20
2024-06-13
2024-07-09
2024-07-09
2024-05-19
2024-07-07
2025-03-05
2025-03-03
2025-03-02
2025-02-28
2025-02-24
2025-02-23
2025-02-15
2025-02-12