AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


腾讯元宝,成功的让我发火了!
发布日期:2024-06-05 02:36:30 浏览次数: 3010 来源:李文君AI思考笔记


腾讯的大模型产品腾讯元宝终于问世了。
这个一贯以“抄”为主的巨无霸,此次又是后发,能不能“制人”,我们拭目以待。
这次主要分享一下使用体验,我是chat·GPT的资深用户了,也每天很多工作也都用到它,它真的很智能。所以在试用腾讯元宝之前,我心里就没有过什么值得期待的预期。
本文很长,主要包括三部分:
1、网页对话体验
2、智能体使用体验
3、总结与思考(重要)
腾讯元宝有,网页版、电脑版、还有ios和安卓版,我这里只体验网页版和ios版本,因为版本只是个载体,各种版本请求的内容都是一样的(背后都是腾讯混元模型生成的)。
 01 
网页AI对话(搜索)体验  
进到官方主页,和GPT一样,需要登录。
网页版是手机号码登录,移动端是微信登录。
正好我最近口腔溃疡,十年的老毛病了,试试让它帮我解决吧。
我先问了一个比较含糊的问题,看看它怎么回答。结果毫不意外的令我失望了。
emmm...生成了一大堆内容,我看不懂。还给我推送了一堆相关的文章,这些文章,我如果想要去了解,在公众号上也可以搜到。
而且文字的生成速度真的是慢。
当然,值得夸奖的是,他所有的内容都是有来源的。
我以为是我提示词不够好,于是就换了一个问法。结果如下:

咦,这次为啥没有内容来源参考了呢?

于是我又问了个问题,这次又有资料参考了:

看样子,问问题的话会给一些参考,是搜索的逻辑(不一定对)。

那问题就来了,这些内容的来源规则是什么呢?
或者说为什么根据这些作为参考呢?为什么又是13篇呢?
于是我一个个点开。
其他就不一一截图了,说结论,我并没有看出有什么规律。
有的是认证的医师,有的是自媒体文章,而且点赞评论的也不多,有的公众号内容,还有两条百度百科。
于是,我有去搜了一下,百度的口腔溃疡关键词,剔除广告和非信息内容,发现这个内容来源也对不上。
所以我有理由推测,他是综合的算法,百度百科抓1-2条,医生的解释抓1-2条或更多,公众号再抓几条,其他媒体再抓几条
而且你们看上面百度百科的截图,可以看到那个关键词是自动输入的。
为了验证我的想法,我可以用其他关键词来测试一下。
这时候我关注到另一个细节:
找到32篇文章,最终引用8篇。
这是我的问题,可以看到,他其实是根据语义进行联系的,我的问题是根据英伟达股价有关的,所以他给我的参考文章都是跟英伟达股价套路相关的。但是从32篇文章中筛选出8篇的逻辑规则是什么我也很难说。
只有一种可能,就是根据这篇文章的内容相关度或者语义接近的频繁度(我自己定义的)来匹配的,具体的算法可能比较复杂,就不在这里讨论了。
所以上面的每种类型都去抓几篇的猜测可能事错误的,但是也有可能每个行业都会有不同的处理方法。谁知道呢?
我的思考(仅供参考):
这种做法的好处在于,有内容来源的依据,所以在内容的信任度上是会增强的。
而坏处就是内容的可信度不能确认。这些地方也是腾讯元宝未来需要重点优化的地方。
至于每次给出的结果呢,也都是根据这些内容做的总结。我之前在体验kimi的时候也是这种感觉,目前国内大模型,只能做到总结与提炼的功能,暂时还不具备真正的智能。
本质上还是一种基于海量数据库进行内容识别,利用AI模型AIGT(智能生成文字)的初级模型罢了。
腾讯大模型和GPT不是一个逻辑,GPT是【AIGC+搜索】的逻辑,腾讯元宝的逻辑是【搜索+AIGC的逻辑。
有什么不同呢?前者重点是AIGC,搜索作为背后数据支撑;而后者重点是搜索,AIGC只是一种手段。
总结就是:腾讯元宝其实是一种和【秘塔AI】类似的搜索类产品。

 02 
智能体体验  
智能体的体验只能在移动端,因为需要语音对话,大部分人的Windows电脑是没办法语音的。
于是我下载了ios版本的腾讯元宝。
正好最近有学习英语的需求,试试排名第二的口语陪练。
刚开始还是比较正常的,你来我往的,我故意说了一些错误的英语,让他给我纠正,效果还不错。
打开的时候,他会主动和我对话,这也是AI交互中比较重要的一点。
然后,关于我得语法错误他会给我语法和发音上的正确与否的判断,还会告诉我优化方案,这一点对于我这个口语渣渣来说很重要!
直到,我说了句:我饿了,他就开始胡言乱语了(我是真的饿了,本想问问他我晚上可以吃点啥)。
这让我很发火的,因为我是在饿的情况下问它的,他给我扯些没用的,是让人很烦的(用户体验),所以可以看出,他还不能识别人的语言语气的情感。
接下来的对话也是乱七八糟的。
咱也不知道,这货怎么就联想到灾害这个词了,而且在之前,他想主动和我聊个话题的时候,我明确告诉他我对AI感兴趣,后面又要跟我聊其他话题,说明在记忆性,个性化需求上是没有做过优化的。
这点在未来的AI ToC产品上尤为重要,很显然,个性化的算法功能腾讯元宝还没有做到,或者虽然做了,但是还不及格!
目前腾讯元宝的智能体库还不是很多,但是我相信未来一定会很多,就像豆包一样,就像当年的公众号、小程序、视频号一样,未来一定会和微信生态融合,从而产生丰富的AI微信生态。
 03 
总结思考  
有3点总结和3点思考(强迫症犯了)
1、国内大模型大部分都是在做【行业+AIGC】的模式,这不是真正意义上的AI,属于一种基于原有业务做AI改造的业务吧。
思考:基于目前国内大模型的能力,我想这也是一种很聪明的做法吧,毕竟各大厂商都在跑马圈地,你不圈地你就会落后。
这也给国内的创业者们提个醒,老老实实的做行业+AI业务,而不是AI+行业的业务,因为时机未到。
2、整个AI圈都是比较焦虑,并且夸大当前AI的能力的,我不否认他有可用的方向,但是真正能落地的场景还是比较少,特别是ToC的业务场景。
思考:大家都处在摸索期,特别是面向普通用户的应用产品,甚至连产品的用户体验都没有形成统一的认知。就拿AI革新的三大要素之一(规模化、专家化、个性化)的个性化这个要素,很多产品经理都没有意识到。一个产品只有具备以上三个要素的时候才有可能是一款成熟的产品。
3、国内大模型又被openai甩开好几条街。之前经过一年的发展,国内的大模型厂商们终于可以松一口气,拍着胸说:我们终于赶上来了,结果人家油门一踩,我们看不到人家了(GPT-4o)!国内大模型们加油!
思考:国内基于大模型的创业者们,在做AI应用方面其实不用太焦虑,毕竟大家都在同一起跑线上,当然,也不是说躺平啥也不做,也要做,只是不能有太多的期待。先锁定、再优化,要随着大模型一起成长,不然等大模型成熟了,估计连骨头渣滓都吃不上。
就那么十几个可以落地的应用场景,都已经卷成了龙卷风,再进去卷也没啥意义。
以上,希望对你有启发。



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询