AI知识库

53AI知识库

学习大模型的前沿技术与行业应用场景


GPT-4o,苹果Siri的拯救者?
发布日期:2024-05-14 19:26:53 浏览次数: 2011 来源:科技资本论


今天OpenAI举行了一个简单随意的小型春季更新会,没有如人们期望的那样发布什么石破天惊的重磅技术,而是由美女CTO Mira 和两个帅哥开发者在轻松愉快的氛围中演示了一个非常好用的大模型GPT-4o。


说它好用,主要体现在几个方面:首先,GPT-4o是跨模态的,同时支持语音、文本和图片。OpenAI的整场演示大部分指令都是用语音,穿插着发一些图片指令,整个操作非常简单,就算不识字或者盲人也能轻松使用。


其次,GPT-4o交流水平已经很接近人类。当你提出一个问题,ChatGPT很快就能做出回答,平均时延为320毫秒,跟人类的反应速度相当。而且GPT-4o说话听上去情绪饱满、有血有肉,完全听不出是一个机器人。


另外,GPT-4o是全能的,能支撑各种场景的应用。OpenAI现场演示了几个应用,第一是在演讲前有点紧张,GPT-4o教你如何深呼吸放松,还能识别出你的呼吸方式不对;第二是晚上睡不着,让GPT-4o讲个睡前故事,它能根据你的要求调整语气和风格;第三是给它一张天气走势图,它能讲出气温的变化;第四是实时翻译,Mira和帅哥经理一个用意大利语、一个用英文也能无缝对话。第五是只要打开摄像头,GPT-4o就能识别你的情绪。


OpenAI 的帅哥不停地用“hi,ChatGPT”来调用GPT-4o,这让我想起了"hi,Siri"。苹果的语音助手Siri存在已经12年了,一直不受用户待见。即使在chatGPT诞生之前,Siri也一直广为诟病,因为它只能帮你设个闹钟、打个电话,或者写条简单的备忘录,如果要查询某个问题,它只能给你搜出一堆链接,被用户嘲讽为智障助手,而且苹果似乎从来没有更新过它。


有了ChatGPT之后,Siri就显得更加愚蠢。苹果也显然意识到了这个问题,并且终于要采取行动了。今年以来传出苹果在和谷歌、openAI洽谈合作,将它们的AI引入iphone。至于最终选择哪一家,至今还没有明确的消息。


OpenAI会是苹果最后选定的合作对象吗?GPT-4o 将拯救siri吗?


从本次产品演示来看,像是OpenAI为GPT-4o取代siri而量身定制的。虽然GPT-4o是一个跨模态的大模型,但OpenAI明显想突出GPT-4o在语音交互上的水平,现场演示都是用语音指令,很像使用siri的方式。


除了语音交互,让GPT-4o分析天气走势图,意思是告诉用户,你可以用GPT-4o直接查询天气情况。推而广之,GPT-4o肯定还能查看股票走势,这是手机用户比较高频的应用。事实上,我经常向Gemini、智谱等大模型(我没有订阅chatGPT plus)发送股价走势截图,让它们分析各种指标,目前来看Gemini表现最好。


GPT-4o的实时翻译功能并不新鲜,因为基于谷歌Gemini nano的三星S24手机已经做到了,看来不管苹果是跟谷歌还是跟openAI合作,iphone很快将上线这个功能。而且我敢说,很快实时翻译功能将成为手机的标配。


至于GPT-4o通过摄像头能识别人物情绪,让我想起了iPhone的Facetime。设想一下,当你在跟别人打视频电话时,你可以通过GPT-4o了解对方的情绪状态,无论是跟亲朋好友电话还是商务会谈,都大有用处。


看完OpenAI的整个演示,我认为,GPT-4o基本满足了我对新Siri的期待。


那么,OpenAI究竟有没有跟苹果达成合作?倘若和苹果达成合作,GPT-4o会直接取代siri,还是成为新Siri背后默默无闻的技术提供方?


有个信号值得注意,那就是OpenAI宣布GPT-4o免费,而且chatGPT订阅用户也不过享受发送消息限制少一点的权利。而在此之前,chatGPT只支持文本。也就是说,OpenAI迫不及待地想让用户使用GPT-4o,迅速地扩展用户规模。目前,chatGPT的周活跃用户超出1亿人。


而且,OpenAI还推出了适用于macos的桌面应用程序,通过简单的键盘快捷键(option+space) 就可以立即向chatGPT提问。


这一切表明,openAI正在通过植入硬件来扩展用户。


PC硬件无非两大生态——mac和windows,windows是openAI的股东和盟友微软的,微软也很给力,破天荒在其PC键盘上增加了一个copilot键。而手机硬件则是苹果和安卓,安卓是谷歌的地盘,不可能接纳openAI,它只可能跟苹果合作。


我认为,OpenAI会不惜代价地跟苹果达成合作,而且极有可能合作已经达成。大概率是它将放弃自己的品牌,隐身幕后做Siri的技术提供者,就如为微软的Copilot提供技术支持。当然,OpenAI将从苹果那里获得丰厚的经济回报,这足以支持它的后续发展。


赶在苹果发布新ios之前,OpenAI先展示一下GPT-4o秀一下肌肉,也为苹果即将发布的新ios做个预热,算是两全其美了。此外,OpenAI也借此向竞争对手谷歌施压,并再一次加强自己是全球AI领导者的品牌形象。


说实在的,如果手机上有一个GPT-4o接口,有什么事情就直接问它,甚至都不用打开手机,的确很酷、很方便。


相比之下,类似三星S24这种采用谷歌AI技术的手机又输了一筹,因为那些AI功能分散在手机原有的功能中,比如阅读摘要功能和浏览器结合,你得先打开浏览器,才能使用这个功能。而且除了实时翻译功能,其它AI功能还不支持语音。当然S24是今年1月发布的,谷歌AI这几个月有哪些进化,明天的2024 I/o大会应该会揭晓。


对于苹果来说,跟OpenAI做朋友可比跟谷歌做朋友更安全。毕竟OpenAI缺钱,而谷歌不缺钱。



53AI,企业落地应用大模型首选服务商

产品:大模型应用平台+智能体定制开发+落地咨询服务

承诺:先做场景POC验证,看到效果再签署服务协议。零风险落地应用大模型,已交付160+中大型企业

联系我们

售前咨询
186 6662 7370
预约演示
185 8882 0121

微信扫码

与创始人交个朋友

回到顶部

 
扫码咨询