AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


AI数据处理实战:如何从每个标题中提取品牌名称?
发布日期:2024-06-09 03:37:13 浏览次数: 2046 来源:白领服务工作室



有时,我们需要从一小段文本内容中提取名牌名称。如果是人工来挑选,在文本较多时,就会显得吃力费时。这时,使用AI大模型来帮助我们提取,是非常高效的。例如下面的例子:

以上是表格的截图,A列的10行,也就是10个单元格,从每个单元格的文本中提取品牌的名称。上面只是10个单元格,如果是几百个或几千个单元格,需要提取品牌名称,会是非常麻烦的事情。如何使用AI大模型来处理呢?

对于使用大模型来说,prompt是非常重要的,不同的prompt,大模型会给出不同的结果。所以,调试出最优的prompt,得到我们所需的结果,才是使用大模型最重要的环节。

1、使用通义大模型

我们调试几次后得到下面的prompt:

任务:提取表格中10个单元格中出现的所有品牌的名称

要求如下:

1、每个单元格提取的结果输出为一行,表格有10个单元格,输出结果也是10行,每行结果前加上1、2、3的序号;

2、如果某个单元格没有品牌名称,则输出无;

3、如果某个单元格有多个品牌名称,请全部提取,并输出为一行,同用中划线将多个品牌名称分隔开。

得到的结果如下所示:


我们看到,有一些小错误:

第3行:优衣库后面错误加上了一些文字

第8行:其实是没有品牌名称,错误提取了一些文字

第10行:多个品牌名称的问界,后面错误加上了汽车

2、使用文心一言大模型

文心大模型无法上传表格,这里直接在prompt里面加上文本,但是如果是大量文本,放在prompt里面,会突破token上限,此时最好直接调用API来完成。

我们调试几次后得到下面的prompt:

文本内容如下:

奥克斯电蚊拍充电式家用强力锂电池灭蚊灯二合一驱蚊神器打苍蝇拍

全棉时代洗脸巾擦脸巾平纹M码洁面巾纯棉柔巾100抽*1包洗面巾

优衣库男装女装凉感大师T AIRism宽松圆领T恤五分袖短袖465185

湿厕纸便携小包10片X1包擦洁厕湿纸巾女性经期湿巾旅行家用维达

防晒服拉夏贝尔女2024夏季新款高倍防晒长袖修身显瘦百搭时尚外套

飞科剃须刀男士电动刮胡刀官方旗舰店正品送男友父亲节礼物送爸爸

三只松鼠手撕面包1000gX1箱零食早餐首选休闲食品三只松鼠蛋糕点心吐司

意式极简床头柜2024新款轻奢高级感实木简约现代卧室床边保险柜子

虎牌保险柜箱智能床头柜一体家用防盗无线充电现代多功能2024新款

我喜欢心心相印的纸巾,你喜欢百果园的水果,他喜欢问界汽车

要求如下:

1、从以上10行文本中出现的所有品牌的名称;

2、每一行文本提取的结果输出为一行,每行结果前加上1、2、3的序号;

3、如果某一行文本中没有品牌名称,则输出无;

4、如果某一行文本中有多个品牌名称,请全部提取,并输出为一行,同用中划线将多个品牌名称分隔开。

得到的结果如下所示:


我们看到,只有1个小错误:

第10行:多个品牌名称的问界,后面错误加上了汽车

相比通义,文心的结果更好。

3、使用豆包大模型

使用的Prompt同文心一言,得到的结果如下:


我们看到,结果完全符合我们的需求,没有任何小错误。看来,豆包的理解能力更强大啊!

总结

通过上面的案例,我们可以得到下面的经验:

1、调试好prompt最重要。

2、不同的大模型,可能会得到的结果,所以,要尝试不同的大模型。

3、在数据量较多时,最好使用API调用。


53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询